刚拿到这个问题,大部分小伙伴肯定会觉得无从下手,数据挖掘的内容那么多,从何下手,所以我也试了一下,先给自己定个大框架,所以一步一步来走出这个过程,然后帮大家呈现下面的内容,不知道的朋友可以来了解一下
`
常见的文本挖掘有以下方式:
1、
读取
txt数据
In [1]: import pandas as pd
In [2]: mydata_txt = pd.read_csv('C:\\test_code.txt',sep = '\t',encoding = 'utf-8')
2、
读取
csv数据
csv文本文件是一种非常常用的数据存储格式,其存储容量远大于Excel电子表格。下面我们来看看如何使用Python读取一个csv格式的数据文件:
In [5]: mydata_csv = pd.read_csv('C:\\test.csv',sep = ',',encoding = 'utf-8')
In [6]: mydata_csv
3、
读取电子表格文件
这里所说的电子表格就是
Excel表格,可以是xls的电子表格,也可以是xlsx的电子表格。在日常工作中,很多数据都是存放在Excel电子表格中的,如果我们需要使用Python对其进行分析或处理的话,第一步就是如何读取Excel数据。下面我们来看看如果读取Excel数据集:
In [7]: mydata_excel = pd.read_excel('C:\\test.xlsx',sep = '\t',encoding = 'utf-8')
In [8]: mydata_excel
4、
读取数据库数据
MySQLdb模块是连接Python和MySQL的中间桥梁,但目前只能在Python2.x运行,但不代表Python3不能连接MySQL数据库。这里介绍一个非常灵活和强大的模块,那就是pymysql模块。我更喜欢它的原因是这个模块可以伪装成 MySQLdb 模块,详情请看下面的例子:
In [1]: import pymysql
In [2]: pymysql.install_as_MySQLdb() #伪装为MySQLdb模块
In [3]: import MySQLdb使用Connection函数联通Python与MySQL
In [4]: conn = MySQLdb.Connection( ...: host = 'localhost', ...: user = 'root', ...: password = 'snake', ...: port = 3306, ...: database = 'test', ...: charset='gbk')使用conn的游标方法(cursor),目的是为接下来的数据库操作做铺垫。
In [5]: cursor = conn.cursor()
In [6]: sql = 'select * from memberinfo'执行SQL语句
In [7]: cursor.execute(sql)Out[7]: 4
In [8]: data = cursor.fetchall()
In [9]: data
好了,以上就是常用的文本挖掘方法,大家可以试试
~
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ python如何获取键盘输入08/22
- ♥ 如何解决python ssl错误11/23
- ♥ 判断python字典中key是否存在的两种方法10/01
- ♥ python猜数字1到1009/20
- ♥ python如何执行windows命令10/02
- ♥ 如何在python中使用zipfile模块?12/21
内容反馈