我正在处理一个.tar.Z格式的文件。我手动更改了它的名称,所以它只会有.tar扩展名,我目前正在努力打开它并读取数据。我似乎找不到我做错了什么。
!pip install tslearn #Library for Time Series
!pip install hmmlearn #Library for Hidden Markov Models
import pandas as pd
import numpy as np
import time # For optimization purposes
import matplotlib.pyplot as plt
from matplotlib import cm
import pylab as pl
import io
from google.colab import drive
#Jupyter notebook option for display
pd.set_option('display.max_rows', None)
np.set_printoptions(threshold=np.inf)
%matplotlib inline
filename='diabetes-data'
uploaded = files.upload()
columnsNames = [
'sequenceName',
'TagIdentificator',
'timestamp',
'dateFORMAT',
'x-coordinate-of-the-tag',
'y-coordinate-of-the-tag',
'z-coordinate-of-the-tag',
'activity'
]
data = pd.read_csv(io.BytesIO(uploaded[filename]+'.tar'),encoding='latin1',header=None,names=columnsNames)
字符串
我做了一些研究,并最终添加了“编码='latin 1'时,有关字符阅读发生错误,但我不知道如何解决这个问题。非常感谢!
1条答案
按热度按时间q3aa05251#
tar.Z表示它不仅仅是一个tar文件,而且还被额外压缩了。据我所知,它是一个zip压缩。你可能需要额外解压。