저는 파이썬의 세계에서 정말 새롭습니다. 나는 이미 trainset과 testset에서 분열의 예를 보았습니다. 그러나 숫자 형으로 만 가능합니다. 예 :입력이있는 문자열로 trainset과 testset으로 나눕니다.
import random
with open("datafile.txt", "rb") as f:
data = f.read().split('\n')
random.shuffle(data)
train_data = data[:50]
test_data = data[50:]
그럼 내가 원하는 것은 정규/상대 표현식에 따라 교육 또는 테스트 세트로 데이터를 분할하는 것입니다. 입력으로 할 수 있습니다. 내가 모든 열매를 가진 칼럼을 가지고 있다고 상상해보십시오. 또 다른 칼로리는 그의 무게로, 또 다른 칼로리는 가격으로 말입니다.하지만 그 중 일부는 가격이 없습니다. 나는 trainset을하기 위해 price> 0 인 사과를 위해 데이터를 나누고, 가격은 0 인 사과를 몇 가지 예측을하기 위해 테스트 세트로 나누고 싶다.
와 나는 데이터 집합으로, 그것을 할 싶어, 나는 내가 잘 설명하지 않는 경우
죄송 예측하기 원하는 내가 입력해야합니다.
그리고 도와 주셔서 감사합니다. 어떤 조언도 감사 할 것입니다. 애플, 무게 : 10 그리고 출력이 훈련을 수행 한 후 가격을되고 싶어
데이터는 그럼 난 과일 같은 입력하려면이
Fruits Weight Price
Apple 5 1
Apple 3 0.6
Apple 3 0
Banana 5 10
Banana 4 8
Banana 2 0
Orange 10 20
Orange 5 12
Orange 2 0
Kiwi 5 6
Kiwi 5 6
Kiwi 2 0
같은 수 있습니다.
도움을 다시 한번 감사드립니다 !!!
import pandas as pd
import numpy as np
df = pd.read_table('datafile.txt', sep='\s+', header=None)
df.fillna(0, inplace=True)
print(df)
print(df.reindex(np.random.permutation(df.index)))
가 제
print
의 출력은
: 그와 NumPy와 대
는 NumPy와 및 부울 색인을 배울 –
* 나는 그것을 설명하지 않으면 잘 * - 그것은 당신이 입력 샘플 및 최종 예상 출력을 게시하는 경우 더 나은 것 – RomanPerekhrest