Installation
- Apercu des briques logicielles
- Installer MongoDB
- Mise en place d'un virtualenv
- Installation du parser LXML
- Installation des dépendances du projet
Apercu des briques logicielles
Crawtext est écrit en Python 2.7 avec une base de données Mongo 3.2
4 étapes d'installation:
-
installation de la base de données en Backend MongoDB
-
installation du parser lxml:
On peut rencontrer certains problèmes à l'installation du package python ```lxml``` que nous contournons ici
-
création d'un environnement virtuel et installation des packages supplémentaire
Il est recommandé d'isoler l'installation de Crawtext dans un ```virtualenv``` et profiter du système d'installation simplifiée avec ```pip```
-
cloner le repository de crawtext
Ou simplement le télécharger en zip
For implementation choice and the necessary what I learnt cf. Developper Guide
Next steps installation are in English. Désolé les gars, j'ai tout commencé en anglais
Install MongoDB
Mongo has to be install first and outside the environnement
-
On LINUX (Debian based distribution): Packages are compatibles with:
-
Debian 7 Wheezy (and older)
-
Ubuntu 12.04 LTS and 14.04 LTS (and older)
-
sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv EA312927
echo "deb http://repo.mongodb.org/apt/debian wheezy/mongodb-org/3.2 main" | sudo tee /etc/apt/sources.list.d/mongodb-org-3.2.list
sudo apt-get update
sudo apt-get install -y mongodb-org=3.2.1 mongodb-org-server=3.2.1 mongodb-org-shell=3.2.1 mongodb-org-mongos=3.2.1 mongodb-org-tools=3.2.1
- On MAC OS/X: (from LionX to newest)
brew update
brew install mongodb --with-openssl
-
On Windows:
Let's verify now that mongo is running properly
$ mongo
MongoDB shell version: 3.2.0
connecting to: test
>
Type Ctrl+C to quit
Install LXML
Install LXML may cause some troubelshooting: to avoid it install additionnal packages outside the environnement
- On Debian
sudo apt-get install libxml2-dev libxslt-dev python-dev
- On MAC
brew install libxml2
brew install libxslt
brew link libxml2 --force
brew link libxslt --force
- On Windows
Select the source file that corresponds to you architecture (32 or 64 bits) open an run it lxml ditributions
Create a virtualenv
Verify that virtualenv is installed
$ virtualenv --version
If you got a “Command not found” when you tried to use virtualenv, try:
$ sudo pip install virtualenv
or
sudo apt-get install python-virtualenv # for a Debian-based system
Create a cortext-box and activate the virtual-env
$ virtualenv cortext-box
$ cd cortext-box
$ source bin/activate
(source bin/deactivate to exit)
Clone the repository
$ git clone https://github.com/cortext/crawtext
$ cd crawtext
or simply download it and install additional packages using the requirements file
$ pip install -r requirements.pip
And that's all for now folks!
Let's see now :
-
how to configure the crawtext environnement
-
and make our first project