2016-10-29 2 views
0

현재 차등 개인 정보 보호 응용 프로그램에 대한 프로젝트를 진행하고 있으며 UCI 기계 학습 저장소에있는 데이터를 시험하고 싶습니다.UCI 기계 학습 저장소의 데이터 세트 사용 방법

제 문제는 MySQL, PostgreSQL 또는 심지어 nosql과 같은 데이터베이스 엔진으로 데이터 세트를 내보낼 때 이런 종류의 리포지토리를 사용하는 것이 새로운 것이라고 생각합니다.

그래서, 내 질문은 어떻게 데이터베이스 엔진에서 이러한 종류의 리포지토리에서 모든 데이터 집합을 사용할 수 있습니다. 나는이 데이터를 사용할 계획입니다

https://archive.ics.uci.edu/ml/datasets/Communities+and+Crime

+0

사용하려는 실제 데이터베이스로 질문을 표시하고 사용할 데이터의 스냅 샷을 포함하십시오. –

+0

@TimBiegeleisen MySQL 데이터베이스를 사용하고 싶습니다. – fudu

답변

1

면책 조항을 설정 : 나도이 가진 경험이 없다.

태그가 붙어 있기 때문에, 그에 대한 대답을 드리겠습니다. 도 비슷합니다.

파일이 CSV 인 것처럼 보이므로 지정된 열 (@attribute)을 사용하여 테이블 (@relation)을 만들 수 있습니다. 각 열을보고 적절한 유형을 확인해야합니다. 숫자는 integer이거나 일부는 numeric/decimal 유형, 문자열은 char 또는 varchar 유형일 수 있습니다.

create table crimepredict (
    state int, 
    county int, 
    community int, 
    communityname varchar(255), 
    fold int, 
    population decimal(3,2), 
    ... 
) 

그리고 quote '' 작품이라면 당신은 COPY 명령

copy crimepredict from '/path/to/communities.data' null '?' delimiter ',' quote '' format csv; 

모르겠어요으로 파일을 가져올 수 있습니다. 그렇지 않으면 가져 오기 전에 데이터 파일을 준비하고 큰 따옴표로 커뮤니티 이름을 묶어야합니다.