UCI 기계 학습 저장소의 데이터 세트 사용 방법

현재 차등 개인 정보 보호 응용 프로그램에 대한 프로젝트를 진행하고 있으며 UCI 기계 학습 저장소에있는 데이터를 시험하고 싶습니다.UCI 기계 학습 저장소의 데이터 세트 사용 방법

제 문제는 MySQL, PostgreSQL 또는 심지어 nosql과 같은 데이터베이스 엔진으로 데이터 세트를 내보낼 때 이런 종류의 리포지토리를 사용하는 것이 새로운 것이라고 생각합니다.

그래서, 내 질문은 어떻게 데이터베이스 엔진에서 이러한 종류의 리포지토리에서 모든 데이터 집합을 사용할 수 있습니다. 나는이 데이터를 사용할 계획입니다

는 https://archive.ics.uci.edu/ml/datasets/Communities+and+Crime

출처

2016-10-29 fudu

사용하려는 실제 데이터베이스로 질문을 표시하고 사용할 데이터의 스냅 샷을 포함하십시오. –

@TimBiegeleisen MySQL 데이터베이스를 사용하고 싶습니다. – fudu

면책 조항을 설정 : 나도이 가진 경험이 없다.

postgresql 태그가 붙어 있기 때문에, 그에 대한 대답을 드리겠습니다. mysql도 비슷합니다.

파일이 CSV 인 것처럼 보이므로 지정된 열 (@attribute)을 사용하여 테이블 (@relation)을 만들 수 있습니다. 각 열을보고 적절한 유형을 확인해야합니다. 숫자는 integer이거나 일부는 numeric/decimal 유형, 문자열은 char 또는 varchar 유형일 수 있습니다.

create table crimepredict (
    state int, 
    county int, 
    community int, 
    communityname varchar(255), 
    fold int, 
    population decimal(3,2), 
    ... 
)

그리고 quote '' 작품이라면 당신은 COPY 명령

copy crimepredict from '/path/to/communities.data' null '?' delimiter ',' quote '' format csv;

모르겠어요으로 파일을 가져올 수 있습니다. 그렇지 않으면 가져 오기 전에 데이터 파일을 준비하고 큰 따옴표로 커뮤니티 이름을 묶어야합니다.

출처

2016-10-29 12:32:30

UCI 기계 학습 저장소의 데이터 세트 사용 방법

답변

관련 문제