pythonsvm内存不足怎么解决?

python

支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器。

python中使用SVM处理大数据时可能会遇到内存不足的情况,新我们就来看一下如何解决内存不足的问题:

我们可以使用python分块读取大数据来避免内存不足,实现代码如下:

import pandas as pd

def read_data(file_name):

    '''

    file_name:文件地址

    '''

    inputfile = open(file_name, 'rb')   #可打开含有中文的地址

    data = pd.read_csv(inputfile, iterator=True)

    loop = True

    chunkSize = 1000    #一千行一块

    chunks = []

    while loop:

        try:

            chunk = data.get_chunk(chunkSize)

            chunks.append(chunk)

        except StopIteration:

            loop = False

            print("Iteration is stopped.")

    data = pd.concat(chunks, ignore_index=True)

    #print(train.head())

    return data

更多Python知识请关注

以上是 pythonsvm内存不足怎么解决? 的全部内容, 来源链接: utcz.com/z/528679.html

回到顶部