[系统开发]
基于Python开发一个全文检索系统
任务编号:599634
悬赏任务39000元
悬赏任务 : 按雇主需求进行任务后提交稿件,被采纳后即获得佣金。
基于Python开发一个全文检索系统
距截止:
任务已圆满完成
雇主已托管赏金:39000 元
雇主发布需求
雇主托管佣金
服务商投稿
雇主开始选稿
任务完成
任务大厅共需1个合格投稿 | 每稿将获得39000 元 | 每人交稿次数不限 可多次任务
投诉举报
联系Ta
我来承接
已有1 个投稿 | 已采纳1 稿 | 拒绝0 稿 | 目前中标名额已满
任务需求:
基于Python开发一个全文检索系统。功能要求为:
使用全文检索引擎对文本进行检索。文本的格式为Word、PDF、TXT。
同时按数据域进行复合条件检索。数据域指文本对应的信息,例如创建人、文件编号、所述部门之类。
对数据域的数据进行基本的维护管理。
对检索结果进行二次检索,二次检索基于程序插件模块进行,包括基于词距(关键词之间的距离)、词频等。部分二次检索功能可以直接在全文引擎中实现,但由于二次检索的规则的广泛性,所以二次检索总是必须的。
对检索结果进行展现,包括对于检索条件相关的内容进行重点展现(如高亮、摘录等)。
根据检索结果查看和下载对应的文件。可以进行批量下载。可以控制下载的权限。
进行检索、查看和下载的Log记录和统计。
进行用户一段时间内下载次数的限制。
控制用户组检索数据域和文件的权限,例如有些用户只能面向部分文件进行检索。
对开发方的要求:
基于Python+Flask开发,可以使用全文检索引擎模块。
对于所开发的程序提供全部源代码及注释、文档。使用第三方模块需要得到需方同意。
不使用开发方的通用组件,除非这些组件代码向需方开放并具有足够的易读性和易维护性。
需方拥有全部知识产权。开发方可以在其他项目中不受限制地使用、复用、修改所开发的代码。
需要在6周内提供包括基本功能的可用版本。
价格及完成时间可谈
|
|
|
|
|