Commit 08517823 authored by Dos Santos David's avatar Dos Santos David

update README

parent c14592de
## Recherche d'informations web ## Recherche d'informations web
### Run our program ### Lancement du programme
If you have docker, you can run Pour lancer le programme en mode interactif :
```shell
$ # lancer le programme pour la collection stanford ou cacm
$ bin/gogole --collection <stanford|cacm>
```
#### Statistiques sur la collection
Vous pouvez ensuite :
* obtenir des statistiques sur les collections: nombre de tokens, taille du vocabulaire, loi de Heap et de Zipf :
```shell
gogole > analyze all
``` ```
docker-compose up
#### Opérations sur l'index
Sur l'index, vous pouvez :
* faire des opérations sur l'index. En général, la première opération dont on a besoin est la construction de l'index :
```shell
gogole > index build
``` ```
Vous pouvez forcer la construction de l'index sans utiliser le cache :
```shell
gogole > index build --no-cache
```
Vous pouvez aussi rechercher les document ids dans lesquels aparait un mot :
But this is broken for now, don't use it ;) ```shell
gogole > index lookup <token>
```
#### Recherche
##### Recherche booléenne
La requête doit être en forme normale conjonctive. Par exemple `a OR b OR c AND d OR e` sera traité en `(a OR b OR c) AND (d OR e)`.
Pour effectuer une requête booléenne (attention l'index doit être construit à l'aide de `index build` auparavant):
```shell
gogole > search -b <query>
gogole > search --bolean <query>
```
Example direcly with python: ##### Recherche vectorielle
```shell
gogole > search -v <query>
gogole > search --vectorial <query>
``` ```
python3 main.py --file-name data/cacm.all --stop-words-file data/common_words analyze all
```
\ No newline at end of file
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment