毕设第一天

2023-03-24 12:27| 来源: 网络整理| 查看: 265

import pandas as pd import networkx as nx # 读取评分数据 rating_data = pd.read_csv(r'E:\Python\pythonProject\ciao\rating.txt', delimiter='\t') # 读取信任网络数据 trust_data = pd.read_csv(r'E:\Python\pythonProject\ciao\trustnetwork.txt', delimiter='\t') # 创建信任网络图 trust_graph = nx.from_pandas_edgelist(trust_data, 'user_id', 'trusted_user_id') # 读取用户统计数据 user_data = pd.read_csv(r'E:\Python\pythonProject\ciao\userstatistic.txt', delimiter='\t')

第一步导入ciao数据库就卡住了，报错：

pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 28664, saw 4

E:\Python\pythonProject\venv\Scripts\python.exe E:/Python/pythonProject/ciao.py Traceback (most recent call last): File "E:\Python\pythonProject\ciao.py", line 5, in rating_data = pd.read_csv(r'E:\Python\pythonProject\ciao\rating.txt', delimiter='\t') File "E:\Python\pythonProject\venv\lib\site-packages\pandas\util\_decorators.py", line 211, in wrapper return func(*args, **kwargs) File "E:\Python\pythonProject\venv\lib\site-packages\pandas\util\_decorators.py", line 331, in wrapper return func(*args, **kwargs) File "E:\Python\pythonProject\venv\lib\site-packages\pandas\io\parsers\readers.py", line 950, in read_csv return _read(filepath_or_buffer, kwds) File "E:\Python\pythonProject\venv\lib\site-packages\pandas\io\parsers\readers.py", line 611, in _read return parser.read(nrows) File "E:\Python\pythonProject\venv\lib\site-packages\pandas\io\parsers\readers.py", line 1778, in read ) = self._engine.read( # type: ignore[attr-defined] File "E:\Python\pythonProject\venv\lib\site-packages\pandas\io\parsers\c_parser_wrapper.py", line 230, in read chunks = self._reader.read_low_memory(nrows) File "pandas\_libs\parsers.pyx", line 808, in pandas._libs.parsers.TextReader.read_low_memory File "pandas\_libs\parsers.pyx", line 866, in pandas._libs.parsers.TextReader._read_rows File "pandas\_libs\parsers.pyx", line 852, in pandas._libs.parsers.TextReader._tokenize_rows File "pandas\_libs\parsers.pyx", line 1973, in pandas._libs.parsers.raise_parser_error pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 28664, saw 4 Process finished with exit code 1

Chatgpt说

根据您提供的错误信息，看起来像是解析 rating.txt 文件时出现了错误。错误信息中指出在第 28664 行出现了预期外的4个字段，而不是1个字段。这通常意味着文件中存在格式错误或数据问题。建议您检查 rating.txt 文件中的第 28664 行，看看是否存在数据格式问题，例如某个字段包含了分隔符，或者该行缺少某个字段。如果您无法确定具体问题所在，您可以尝试使用 error_bad_lines=False 参数来跳过包含错误行的数据，例如：

pythonCopy code rating_data = pd.read_csv('E:\\Python\\pythonProject\\ciao\\rating.txt', delimiter='\t', error_bad_lines=False)

这将跳过包含错误行的数据，并继续解析其他数据。但是请注意，这可能会导致数据的丢失或解析错误，因此最好仍然尽可能确定问题所在并尝试修复文件。

so，文件28664行格式不对，可能有分隔符，但是文件太大了我又不可能去找，而且用 error_bad_lines=False，虽然正确录入但还有后续问题，发现这样的情况有很多处。

如何在anaconda prompt里面换行？ --未解决

【本文地址】

公司简介

联系我们