
  • Apercu des briques logicielles
  • Installer MongoDB
  • Mise en place d'un virtualenv
  • Installation du parser LXML
  • Installation des dépendances du projet

Apercu des briques logicielles

Crawtext est écrit en Python 2.7 avec une base de données Mongo 3.2

4 étapes d'installation:

  • installation de la base de données en Backend MongoDB

  • installation du parser lxml:

    On peut rencontrer certains problèmes à l'installation du package python ```lxml```
    que nous contournons ici
  • création d'un environnement virtuel et installation des packages supplémentaire

    Il est recommandé d'isoler l'installation de Crawtext dans un ```virtualenv```
    et profiter du système d'installation simplifiée avec ```pip```
  • cloner le repository de crawtext

    Ou simplement le télécharger en zip

For implementation choice and the necessary what I learnt cf. Developper Guide

Next steps installation are in English. Désolé les gars, j'ai tout commencé en anglais

Install MongoDB

Mongo has to be install first and outside the environnement

  • On LINUX (Debian based distribution): Packages are compatibles with:

    • Debian 7 Wheezy (and older)

    • Ubuntu 12.04 LTS and 14.04 LTS (and older)

sudo apt-key adv --keyserver hkp:// --recv EA312927
echo "deb wheezy/mongodb-org/3.2 main" | sudo tee /etc/apt/sources.list.d/mongodb-org-3.2.list
sudo apt-get update
sudo apt-get install -y mongodb-org=3.2.1 mongodb-org-server=3.2.1 mongodb-org-shell=3.2.1 mongodb-org-mongos=3.2.1 mongodb-org-tools=3.2.1
  • On MAC OS/X: (from LionX to newest)
brew update
brew install mongodb --with-openssl

Let's verify now that mongo is running properly

$ mongo
MongoDB shell version: 3.2.0
connecting to: test

Type Ctrl+C to quit

Install LXML

Install LXML may cause some troubelshooting: to avoid it install additionnal packages outside the environnement

  • On Debian
sudo apt-get install libxml2-dev libxslt-dev python-dev
  • On MAC
brew install libxml2
brew install libxslt
brew link libxml2 --force
brew link libxslt --force
  • On Windows

Select the source file that corresponds to you architecture (32 or 64 bits) open an run it lxml ditributions

Create a virtualenv

Verify that virtualenv is installed

$ virtualenv --version

If you got a “Command not found” when you tried to use virtualenv, try:

$ sudo pip install virtualenv


sudo apt-get install python-virtualenv # for a Debian-based system

Create a cortext-box and activate the virtual-env

$ virtualenv cortext-box
$ cd cortext-box
$ source bin/activate

(source bin/deactivate to exit)

Clone the repository

$ git clone
$ cd crawtext

or simply download it and install additional packages using the requirements file

$ pip install -r requirements.pip

And that's all for now folks!

Let's see now :