.tsv
Code
TSV(制表符分隔值)
TSV 是一种表格数据格式,使用制表符而非逗号来分隔列。由于数据值中很少出现制表符,TSV 避免了 CSV 的引号复杂性,使得许多生物信息学和数据科学工作流程的解析更为简单。
MIME 类型
text/tab-separated-values
类型
文本
压缩
无损
优点
- + Simpler parsing than CSV — no quoting rules needed
- + Tabs rarely appear in data, reducing ambiguity
- + Standard in bioinformatics and scientific data pipelines
缺点
- − Less universally recognized than CSV in business tools
- − Cannot represent values containing tab characters
- − Some spreadsheet tools default to CSV, not TSV
何时使用 .TSV
当数据值经常包含逗号时,或在以 TSV 为惯例的科学和生物信息学管道中使用 TSV。
技术细节
TSV 文件使用制表符(\t)作为列分隔符,换行符作为行分隔符。与 CSV 不同,TSV 不需要引号 — 字段中不能包含制表符或换行符。
历史
制表符分隔文件从最早的大型机数据处理时代就已存在。TSV 被正式注册为 IANA 媒体类型 text/tab-separated-values,常用于生物信息学(BLAST 输出)、语言学和数据仓库。