Previous Next Table of Contents

2. Le moteur de recherche

2.1 Pour l'utilisateur:

Introduction

Ces outils devront fonctionner sous plusieurs environnements ( Linux, freeBSD , autres Unix , MS-Windows , MacOS si possible , BE OS a voir , Amiga et autre play station ... hum .. ( Amstrad CPC et Videopack c'est IMPÉRATIF :). Pourquoi vouloir être aussi portable ? Posez la question au gens qui ne parviennent pas à installer un Unix libre !

Solutions disponibles ( python, perl, tcl-tk ).

Je précise qu'un CD ayant la portabilité souhaitée a déjà été créé avec Zope ( python ) ( www.zope.org ). Il serait intéressant d'approfondir cette voie. Cependant Zope stocke tout dans une base de données et interdit donc d'accéder aux fichiers directement. ( un nouveau module permet de le faire, cependant une autre solution a déjà été mis en place pendant ce temps). Ceci peut être très génant par la suite.

Cependant la majorité des systèmes possédent un buttineur web, on peut alors mettre sur le média un serveur web pret à l'emploi. (Il y a un problème sous MS Windows, l'emploi d'un butineur WEB demande la configuration de la pile tcp /ip et ce serveur httpd en tcl nessecite la version de tcl 8 ) Ceci nous évitera bien des problèmes et pourra aporter une solution dans la majorité des cas.Par exemple sous un unix en mode console ( tty ) l'utilisation de lynx pourra remplir amplement la mission que l'on desire remplir. ( Je déconseille l'utilisation d'un serveur X avec aaalib :). Pour ceux qui n'ont pas de butineur ou qui n'ont pas de reseau ( pile tcp/ip ), il est facillement envisagable de faire un mini butineur web qui lira directement sur le file systeme les fichiers html sans passer par l'intermédiaire d'un serveur. Par exemple

Nous avons alors il me semble une solution complete.

2.2 Pour l'entreprise

On peut compacter le maximum de doc sur un CD avec des outils comme gzip ou bzip2 et les relire avec un module Apache décompactant à la volée. ( www.apache.org ). il existe un module .gz

solutions disponible

apache et (htdig ou glimpse). la base d'indexation d'htdig occupe environ le même espace que les docs : pour 117 Mo de doc, 114 Mo de base de données. Cette solution serait exploitable via un réseau interne. Ces excellents logiciels utilisent un format binaire pour leur base d'indexation.

2.3 Pour l'internet

La même chose que le CD pour l'entreprise mais online. HTDIG paraît une bonne solution pour l'instant, cependant si l'on adopte une solution pour le CD, il serait bon de ne pas se diversifer.

solutions disponible

Avec la réalisation de indexation, nous nous sommes apercu qu'on pouvez réaliser un moteur de recherche à partir d'un base de donnée et de PHP. Vous pourrez trouver ce type de moteur sur les HOWTO Francais a l'adresse : http://apodeline.free.fr/search.php3.


Previous Next Table of Contents