毕设第一天 您所在的位置:网站首页 python画图导入数据 毕设第一天

毕设第一天

2023-03-24 12:27| 来源: 网络整理| 查看: 265

import pandas as pd import networkx as nx # 读取评分数据 rating_data = pd.read_csv(r'E:\Python\pythonProject\ciao\rating.txt', delimiter='\t') # 读取信任网络数据 trust_data = pd.read_csv(r'E:\Python\pythonProject\ciao\trustnetwork.txt', delimiter='\t') # 创建信任网络图 trust_graph = nx.from_pandas_edgelist(trust_data, 'user_id', 'trusted_user_id') # 读取用户统计数据 user_data = pd.read_csv(r'E:\Python\pythonProject\ciao\userstatistic.txt', delimiter='\t')

第一步导入ciao数据库就卡住了,报错:

pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 28664, saw 4

E:\Python\pythonProject\venv\Scripts\python.exe E:/Python/pythonProject/ciao.py Traceback (most recent call last): File "E:\Python\pythonProject\ciao.py", line 5, in rating_data = pd.read_csv(r'E:\Python\pythonProject\ciao\rating.txt', delimiter='\t') File "E:\Python\pythonProject\venv\lib\site-packages\pandas\util\_decorators.py", line 211, in wrapper return func(*args, **kwargs) File "E:\Python\pythonProject\venv\lib\site-packages\pandas\util\_decorators.py", line 331, in wrapper return func(*args, **kwargs) File "E:\Python\pythonProject\venv\lib\site-packages\pandas\io\parsers\readers.py", line 950, in read_csv return _read(filepath_or_buffer, kwds) File "E:\Python\pythonProject\venv\lib\site-packages\pandas\io\parsers\readers.py", line 611, in _read return parser.read(nrows) File "E:\Python\pythonProject\venv\lib\site-packages\pandas\io\parsers\readers.py", line 1778, in read ) = self._engine.read( # type: ignore[attr-defined] File "E:\Python\pythonProject\venv\lib\site-packages\pandas\io\parsers\c_parser_wrapper.py", line 230, in read chunks = self._reader.read_low_memory(nrows) File "pandas\_libs\parsers.pyx", line 808, in pandas._libs.parsers.TextReader.read_low_memory File "pandas\_libs\parsers.pyx", line 866, in pandas._libs.parsers.TextReader._read_rows File "pandas\_libs\parsers.pyx", line 852, in pandas._libs.parsers.TextReader._tokenize_rows File "pandas\_libs\parsers.pyx", line 1973, in pandas._libs.parsers.raise_parser_error pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 28664, saw 4 Process finished with exit code 1

Chatgpt说

根据您提供的错误信息,看起来像是解析 rating.txt 文件时出现了错误。错误信息中指出在第 28664 行出现了预期外的4个字段,而不是1个字段。这通常意味着文件中存在格式错误或数据问题。建议您检查 rating.txt 文件中的第 28664 行,看看是否存在数据格式问题,例如某个字段包含了分隔符,或者该行缺少某个字段。如果您无法确定具体问题所在,您可以尝试使用 error_bad_lines=False 参数来跳过包含错误行的数据,例如:

pythonCopy code rating_data = pd.read_csv('E:\\Python\\pythonProject\\ciao\\rating.txt', delimiter='\t', error_bad_lines=False)

这将跳过包含错误行的数据,并继续解析其他数据。但是请注意,这可能会导致数据的丢失或解析错误,因此最好仍然尽可能确定问题所在并尝试修复文件。

so,文件28664行格式不对,可能有分隔符,但是文件太大了我又不可能去找,而且用 error_bad_lines=False,虽然正确录入但还有后续问题,发现这样的情况有很多处。

如何在anaconda prompt里面换行? --未解决



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有