古风君子以泽,管理书籍排行榜,玄幻小说排行榜完本

主頁(yè) > 知識(shí)庫(kù) > python 讀取以空格分開(kāi)的文件操作

python 讀取以空格分開(kāi)的文件操作

在查找數(shù)據(jù)集的時(shí)候發(fā)現(xiàn)，并不是所有的數(shù)據(jù)集都是以csv的格式存儲(chǔ)，也就是每一列特征數(shù)據(jù)的分割并不是都以逗號(hào)分割，有的數(shù)據(jù)格式是以空格為分割

例如.data格式，

接下來(lái)就實(shí)現(xiàn)對(duì).data格式數(shù)據(jù)的讀?。?/h2>

(數(shù)據(jù)來(lái)源于Boston房?jī)r(jià)預(yù)測(cè)數(shù)據(jù)集，文件名稱為“housing.data”)

import pandas as pd
data = pd.read_csv('./housing.data', delim_whiteshape=True)

以上代碼就是實(shí)現(xiàn)了對(duì)空格的分割，但是不知道針對(duì)也是以一列存儲(chǔ)，并且數(shù)據(jù)分割也是空格的csv文件此方法還行得通不。

另外pd.read_csv()中的參數(shù)sep和delimiter表示的意義一樣，具體如何使用不清楚，目前用到不多。

遇到讀取文件不知如何操作的，最后要訪問(wèn)下官方文檔或者google查詢。

pd.read_csv官方文檔

另外，可以直接在原數(shù)據(jù)集文件加后綴名.csv即可轉(zhuǎn)換成csv文件，但前提是data中的數(shù)據(jù)已經(jīng)以，分割好了。

pd.read_csv()中讀取文件時(shí)，默認(rèn)第一行作為列名，但有時(shí)候第一行也是我們需要的數(shù)據(jù)，這時(shí)需制定參數(shù)header=None，或者給每列提前設(shè)置好名字，names=[‘column0',‘column1',…]

補(bǔ)充：python 實(shí)現(xiàn)以空格分隔的文件讀寫(xiě)及二維數(shù)組按列折半查找

最近文件讀寫(xiě)的工作比較多，每一次讀文件都會(huì)寫(xiě)單獨(dú)的函數(shù)來(lái)適應(yīng)文件格式，所以寫(xiě)了一個(gè)類對(duì)文件進(jìn)行操作。

（用pandas.read_csv讀取文件更好用）

import os
class DealData:
    # 數(shù)據(jù)加載函數(shù)
    def load(self, filename):
        data = []
        file = open(filename, 'r')
        for line in file.readlines():
            line = line.strip('\n')         # 除去換行
            line = line.split(' ')          # 文件以“ ”分隔
            if "" in line:                  # 解決每行結(jié)尾有空格的問(wèn)題
                line.remove("")
            data.append(line)
        file.close()
        return data
 
    # 折半查找                               # array是一個(gè)二維數(shù)組，函數(shù)實(shí)現(xiàn)的功能是按照array的第lie列折半查找
    def search(self, array, lie, target):
        low = 0
        high = len(array) - 1
        while array[low][lie] = array[high][lie]:
            mid = int((low + high) / 2)
            midval = array[mid][lie]
            if midval  target:
                low = mid + 1
            elif midval > target:
                high = mid - 1
            if high  0 or low >= len(array):
                break
        return high
    # 將數(shù)據(jù)保存到文件                
    def save(self, data, filename):
        file = open(filename, 'w')
        for i in range(0, len(data), 1):
            for k in range(0, len(data[i]), 1):
                file.write(str(data[i][k]))
                file.write(" ")
            file.write("\n")
        file.close()

可以將Dealdata類單獨(dú)創(chuàng)建一個(gè)python文件，命名為Dealdata，調(diào)用方法如下：

from DealData import DealData 
deal = DealData()
totaldata = deal.load("E:\low_data.txt")

之前先引用類：from Dealdata import Dealdata，其中第一個(gè)Dealdata為被調(diào)用的python文件名，第二個(gè)Dealdata為被調(diào)用的類名。

以上為個(gè)人經(jīng)驗(yàn)，希望能給大家一個(gè)參考，也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教。

您可能感興趣的文章:

python將每個(gè)單詞按空格分開(kāi)并保存到文件中
Python 如何將字符串每?jī)蓚€(gè)用空格隔開(kāi)
Python 字符串去除空格的五種方法
解決python的空格和tab混淆而報(bào)錯(cuò)的問(wèn)題
去除python中的字符串空格的簡(jiǎn)單方法
python 解決Windows平臺(tái)上路徑有空格的問(wèn)題
Python 實(shí)現(xiàn)一行輸入多個(gè)數(shù)字(用空格隔開(kāi))

標(biāo)簽：衡水股票呼和浩特湖州駐馬店中山畢節(jié) 江蘇

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《python 讀取以空格分開(kāi)的文件操作》，本文關(guān)鍵詞 python,讀取,以,空格,分開(kāi),；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無(wú)關(guān)。

濮阳杆衣贸易有限公司

python 讀取以空格分開(kāi)的文件操作

（用pandas.read_csv讀取文件更好用）