实现文章搜索搜索引擎(一)
实现功能:通过关键词检索文章,对检索出的文章做主题分析。
开发思路
- 搭建并配置Django开发环境
- 前端界面的编写和数据库的设计
- 编写TF-IDF算法,将与用户输入关键词最相关的5篇文章返回
- 编写LDA算法,对返回的内容做主题概率运算
- 使用Xadmin完成后台
Django介绍和环境搭建
Django介绍
Django是由Python写成一个开放源代码的Web应用框架,采用了MVC的软件设计模式,使得开发复杂的、数据库驱动的网站变得简单。
Django框架的核心包括:
- 一个面向对象的映射器,用作数据模型和关系性数据库间的媒介
- 一个基于正则表达式的URL分发器
- 一个视图系统,用于处理请求
- 一个模板系统
环境搭建
1 2 3 4 5 6
| $ conda create sas python=3.4 $ source activate sas $ pip install Django $ pip install requests $ pip install mysqlclient $ django-admin startproject sas
|
wsgi:部署到服务器上用。
manage:相当于命令工具,创建用户等。
setting中数据库的配置:
1 2 3 4 5 6 7 8 9 10 11 12 13
| DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': 'FileDB', 'USER':'root', 'PASSWORD':'root', 'HOST':'127.0.0.1', 'OPTIONS':{ "init_command":"SET foreign_key_check=0;", } } }
|
Django相关命令操作:
1 2 3 4 5 6
| pycharm>>Tools>>Run manage.py task manage.py@sas > makemigrations(查看项目数据库有没有变动) manage.py@sas > migrate(生成Django相关的数据表) run on localhost:8000 exit manage.py@sas > startapp article
|
setting中注册app项目:
1 2 3 4 5 6 7 8 9
| INSTALLED_APPS = [ 'django.contrib.admin', 'django.contrib.auth', 'django.contrib.contenttypes', 'django.contrib.sessions', 'django.contrib.messages', 'django.contrib.staticfiles', 'article', ]
|