知行编程网知行编程网  2023-01-13 14:30 知行编程网 隐藏边栏  4 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于如何使用python实现文本数据挖掘?的相关知识,希望可以帮到处于编程学习途中的小伙伴


刚拿到这个问题,大部分小伙伴肯定会觉得无从下手,数据挖掘的内容那么多,从何下手,所以我也试了一下,先给自己定个大框架,所以一步一步来走出这个过程,然后帮大家呈现下面的内容,不知道的朋友可以来了解一下


`




常见的文本挖掘有以下方式:




1、





读取

txt数据

In [1]: import pandas as pd
In [2]: mydata_txt = pd.read_csv('C:\\test_code.txt',sep = '\t',encoding = 'utf-8')


2、




读取

csv数据

csv文本文件是一种非常常用的数据存储格式,其存储容量远大于Excel电子表格。下面我们来看看如何使用Python读取一个csv格式的数据文件:

In [5]: mydata_csv = pd.read_csv('C:\\test.csv',sep = ',',encoding = 'utf-8')
In [6]: mydata_csv


3、




读取电子表格文件




这里所说的电子表格就是

Excel表格,可以是xls的电子表格,也可以是xlsx的电子表格。在日常工作中,很多数据都是存放在Excel电子表格中的,如果我们需要使用Python对其进行分析或处理的话,第一步就是如何读取Excel数据。下面我们来看看如果读取Excel数据集:

In [7]: mydata_excel = pd.read_excel('C:\\test.xlsx',sep = '\t',encoding = 'utf-8')
In [8]: mydata_excel


4、




读取数据库数据


MySQLdb模块是连接Python和MySQL的中间桥梁,但目前只能在Python2.x运行,但不代表Python3不能连接MySQL数据库。这里介绍一个非常灵活和强大的模块,那就是pymysql模块。我更喜欢它的原因是这个模块可以伪装成 MySQLdb 模块,详情请看下面的例子:

In [1]: import pymysql
In [2]: pymysql.install_as_MySQLdb()    #伪装为MySQLdb模块
In [3]: import MySQLdb使用Connection函数联通Python与MySQL
In [4]: conn = MySQLdb.Connection(   ...:        host = 'localhost',   ...:        user = 'root',   ...:        password = 'snake',   ...:        port = 3306,   ...:        database = 'test',   ...:        charset='gbk')使用conn的游标方法(cursor),目的是为接下来的数据库操作做铺垫。
In [5]: cursor = conn.cursor()
In [6]: sql = 'select * from memberinfo'执行SQL语句
In [7]: cursor.execute(sql)Out[7]: 4
In [8]: data = cursor.fetchall()
In [9]: data



好了,以上就是常用的文本挖掘方法,大家可以试试

~

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享