首页 python正文

python中tsv文件的读取方法

启明SEO python 2023-07-27 13:21:51 1888 2 tsv

tsv 文档是什么?TSV 文档 代表 制表符分隔值文档。以表格形式存储数据的文本报表。

TSV 文档格式通常用于使用数据库表或电子表格信息在数据库之间交换事实。每个文档由制表符人 ( \t ) 分隔。用作.csv布局的替代格式。

.tsv 和.csv格式之间的区别在于,.csv布局使用逗号来拆分事实列,而 .tsv 格式使用制表符来拆分列。

如何搜索TSV?对于解析 CSV/TSV 文件,我们已经这样做了,如下所述 -


单击逗号 (CSV) 以用逗号分隔列。单击制表符 (TSV) 以用制表符分隔列。单击“空格”以用空格分隔列。单击“自定义字符”以输入用于分隔列的字符。注意:使用反斜杠 (\) 转义特殊字符。

Python如何读取.TSV文件?

tsv_file = open("example.tsv")  
read_tsv = csv.Reader(tsv_file, delimiter="\t")  
for row in read_tsv :  
    print(row)  
tsv_file.close()

Python读取TSV文档如何使用函数:可以使用 open() 特性在 Python 中研究 tsv 文件。可以使用 open() 函数检查特定文档。学习后返回相同的文件项。open ()对文档执行一些文件处理操作,如读取、写入、追加和创建文件。

打开文件后,使用 CSV 中的 reader() 将文件对象转换为 CSV.reader 对象。要使用阅读器,请先导入 CSV。接下来,编写 open() 函数。将使用一个名为“product.tsv”的 tsv 文件,该文件由 12 个月内三种产品的销售数据组成。将 tsv 文件作为参数传递给 open() 函数。“file”是一个文件对象。然后使用 csv.reader 将文件对象转换为 csv.reader 对象。将分隔符作为“\t”传递给 CSV。

方法1: 使用pandas

使用pandas read_csv()从TSV文件读取数据。在tsv文件中,一个制表符分隔了每个字段,因此在tsv文件中传递制表符分隔符“\t”。

下面给出了使用pandas的语法:

data=pandas.read_csv('filename.tsv',sep='\t')


示例:在这里给出一个在python中使用pandas的例子 -

import pandas as pd  
interviews_df = pd.read_csv('Daily report and monthly report(December 2022).tsv', sep='\t')  
print(interviews_df)


编译上面的程序,编译成功后运行。结果如下所示 - 

Date    Topic Name    Word Count
1st December,2022    Parse error python    727
2nd December,2022    Pass function as parameter python    734
3rd December,2022    Parsing data in python    764


方法2: csv的使用

使用csv.reader()将tsv文件对象转换为csv.reader对象。并将分隔符“\t”传递给csv.reader。分隔符用于指定分隔每个字段的字符。

csv的使用语法如下-

with open("filename.tsv") as file:  
tsv_file = csv.reader(file, delimiter="\t")


在这里给出一个在python中使用pandas的例子 -

import csv  
with open("'Daily report and monthly report(December 2022).tsv") as file:  
tsv_file = csv.reader(file, delimiter="\t")  
for line in tsv_file:  
    print(line)


方法3:split的使用

在Python中从TSV文件读取数据的一个非常简单的方法是使用split()。可以读取特定的TSV文件并将其数据保存在列表中。

split()语法如下-

with open("filename.tsv") as file:  
for the line in file:  
l=line.split('\t')

在这里,给出一个在python中使用pandas的例子 - 

ans = []  
with open("Javatpoint.tsv") as f: 
   for line in f:  
       l=line.split('\t')  
       ans.append(l)  
for a in ans:  
    print(a)



评论

Python好学公众号

好文推荐

实时访客入口页面出现bd_vid=标识是什么原因

实时访客入口页面出现bd_vid=标识是什么原因

最近查看百度实时访客,总是会看到入口页面会多......

有了微信视频号,但是没有发布权限,怎么开通

有了微信视频号,但是没有发布权限,怎么开通

视频号是微信在2020年1月19号开始内测的......

如何用python抓取爱企查企业信息

如何用python抓取爱企查企业信息

前段时间,经理让我去找一些企业的信息,我平常......

服务器配置低,宝塔面板安装IIS总是安装不上怎么办

服务器配置低,宝塔面板安装IIS总是安装不上怎么办

对于一般企业网站或者博客来说,对服务器的配置......

如何修改浏览器指纹,Canvas指纹、Webgl指纹、Audio指纹修改方法?

如何修改浏览器指纹,Canvas指纹、Webgl指纹、Audio指纹修改方法?

修改浏览指纹的方法其实也是很简单,主要使用到......

win10下安装MYSQL后,提示Can't connect to MySQL server on localhost (10061)相关问题解决方法

win10下安装MYSQL后,提示Can't connect to MySQL server on localhost (10061)相关问题解决方法

我遇到的问题是电脑原先安装过mysql,卸......