Welcome to CortextDoc

Documentation langage is not yet stabilized. Installation procedure is in english Tutorial in french

What is Crawtext?

Crawtext is web-crawler that collect textual data on the web around a specific theme. You'll find here how to configure crawtext and run a crawl

Qu'est ce que Crawtext?

Crawtext est un crawler ou un robot d'indexation de texte qui permet la constitution de gros corpus web textuels issus de page web autour d'une expression de recherche donnée de manière récurrente selon la fréquence souhaitée.

Initialement prévue pour être intégrée à la plateforme Cortext Manager comme un outil de constitution de datasets issu du web. Elle fonctionne pour le moment en mode console et de manière indépendante.