在Python3中迭代文件行时`tell()`的替代方法？

您所在的位置：网站首页 › pythontell方法 › 在Python3中迭代文件行时`tell()`的替代方法？

在Python3中迭代文件行时`tell()`的替代方法？

2024-07-08 11:56:02| 来源: 网络整理| 查看: 265

在迭代Python3中的文件时,如何找出文件光标的位置？

在Python 2.7中,它是微不足道的,使用tell().在Python3中,同一个调用抛出OSError:

Traceback (most recent call last): File "foo.py", line 113, in check_file pos = infile.tell() OSError: telling position disabled by next() call

我的用例是创建一个用于读取大型CSV文件的进度条.计算总行数太昂贵,需要额外通过.一个近似值非常有用,我不关心缓冲区或其他噪声源,我想知道它是否需要10秒或10分钟.

简单的代码重现问题.它在Python 2.7上按预期工作,但抛出Python 3:

file_size = os.stat(path).st_size with open(path, "r") as infile: reader = csv.reader(infile) for row in reader: pos = infile.tell() # OSError: telling position disabled by next() call print("At byte {} of {}".format(pos, file_size))

这个答案/sf/ask/17360801/表明问题是该next()方法tell()在迭代期间禁用.替代方案是逐行手动读取,但该代码在CSV模块内,所以我无法得到它.我也无法通过禁用来理解Python 3的收益tell().

那么在迭代Python 3中的文件行时找出字节偏移量的首选方法是什么？

1> Serge Balles..：

csv模块只需要reader调用的第一个参数是一个迭代器,它在每次next调用时返回一行.所以你可以使用迭代器包装器来计算字符数.如果您希望计数准确,则必须以二进制模式打开文件.但事实上,这很好,因为你将没有csv模块预期的行结束转换.

所以可能的包装是:

class SizedReader: def __init__(self, fd, encoding='utf-8'): self.fd = fd self.size = 0 self.encoding = encoding # specify encoding in constructor, with utf8 as default def __next__(self): line = next(self.fd) self.size += len(line) return line.decode(self.encoding) # returns a decoded line (a true Python 3 string) def __iter__(self): return self

您的代码将变为:

file_size = os.stat(path).st_size with open(path, "rb") as infile: szrdr = SizedReader(infile) reader = csv.reader(szrdr) for row in reader: pos = szrdr.size # gives position at end of current line print("At byte {} of {}".format(pos, file_size))

这里的好消息是你保留了csv模块的所有功能,包括引用字段中的换行符......

【本文地址】

公司简介

联系我们

今日新闻

点击排行

实验室常用的仪器、试剂和: 说到实验室常用到的东西，主要就分为仪器、试剂和耗

不用再找了，全球10大实验: 01、赛默飞世尔科技（热电）Thermo Fisher Scientif

三代水柜的量产巅峰T-72坦: 作者：寞寒最近，西边闹腾挺大，本来小寞以为忙完这

通风柜跟实验室通风系统有: 说到通风柜跟实验室通风，不少人都纠结二者到底是不

集消毒杀菌、烘干收纳为一: 厨房是家里细菌较多的地方，潮湿的环境、没有完全密

实验室设备之全钢实验台如: 全钢实验台是实验室家具中较为重要的家具之一，很多

图片新闻

实验室药品柜的特性有哪些: 实验室药品柜是实验室家具的重要组成部分之一，主要

小学科学实验中有哪些教学: 计算机计算器一般打孔器打气筒仪器车显微镜

实验室各种仪器原理动图讲: 1.紫外分光光谱UV分析原理：吸收紫外光能量，引起分

高中化学常见仪器及实验装: 1、可加热仪器：2、计量仪器：（1）仪器A的名称：量

微生物操作主要设备和器具: 今天盘点一下微生物操作主要设备和器具，别嫌我啰嗦

浅谈通风柜使用基本常识: 　众所周知，通风柜功能中最主要的就是排气功能。在

在Python3中迭代文件行时`tell()`的替代方法？

在Python3中迭代文件行时`tell()`的替代方法？

今日新闻

点击排行

推荐新闻

图片新闻

专题文章