EDIT 2014-05-01 : 나는 fromJSON을 먼저 시도했지만 (아래에 제안 됨), 첫 번째 행만 구문 분석했습니다. 각 JSON 줄의 괄호 사이에 쉼표가 없으므로 TextEdit에서이를 변경하고 파일을 저장했습니다. 나는 또한 [파일의 시작과 끝]에 JSON을 추가했다. 이제 다음 단계 :리스트 (임베디드리스트 포함)에서 데이터 프레임 (또는 CSV)에 이르기까지..mongo 파일을 열고 CSV로 콘텐츠를 내보내는 방법은 무엇입니까?
나는 지금 우리가 평가하는 코스에서 edX로부터 데이터 패키지를 얻습니다. 이들 중 일부는 처리하기 쉬운 일반 .csv 파일이고 다른 파일은 나를 위해 더 어렵습니다 (CS 또는 프로그래밍 배경 없음).
나는 R에서 분석을 위해 CSV 파일을 열어서 구문 분석하려고하는 두 개의 파일이 있습니다. 많은 json2csv 도구를 사용해 보았지만 아무 소용이 없습니다. 나는 또한 json을 csv로 바꾸기 위해 여기에 설명 된 간단한 방법을 시도했다.
데이터는 기밀이므로 전체 데이터 세트를 공유 할 수는 없지만 파일의 처음 두 줄을 공유하므로 도움이됩니다. 문제는 .mongo 파일에 대해 아무 것도 발견하지 못한다는 것입니다. 매우 이상하게 보입니다. 심지어 존재합니까? 또는이 오류가 설명 된 JSON 파일이 손상되었을 수 있습니까?
모든 의견을 환영합니다. .mongo 파일 중 하나에
첫 번째 2 개 라인 :
{
"_id": {
"$oid": "52d1e62c350e7a3156000009"
},
"votes": {
"up": [
],
"down": [
],
"up_count": 0,
"down_count": 0,
"count": 0,
"point": 0
},
"visible": true,
"abuse_flaggers": [
],
"historical_abuse_flaggers": [
],
"parent_ids": [
],
"at_position_list": [
],
"body": "the delft university accredited course with the scholarship (fundamentals of water treatment) is supposed to start in about a month's time. But have the scholarship list been published? Any tentative date??",
"course_id": "DelftX/CTB3365x/2013_Fall",
"_type": "Comment",
"endorsed": false,
"anonymous": false,
"anonymous_to_peers": false,
"author_id": "269835",
"comment_thread_id": {
"$oid": "52cd40c5ab40cf347e00008d"
},
"author_username": "tachak59",
"sk": "52d1e62c350e7a3156000009",
"updated_at": {
"$date": 1389487660636
},
"created_at": {
"$date": 1389487660636
}
}{
"_id": {
"$oid": "52d0a66bcb3eee318d000012"
},
"votes": {
"up": [
],
"down": [
],
"up_count": 0,
"down_count": 0,
"count": 0,
"point": 0
},
"visible": true,
"abuse_flaggers": [
],
"historical_abuse_flaggers": [
],
"parent_ids": [
{
"$oid": "52c63278100c07c0d1000028"
}
],
"at_position_list": [
],
"body": "I got it. Thank you!",
"course_id": "DelftX/CTB3365x/2013_Fall",
"_type": "Comment",
"endorsed": false,
"anonymous": false,
"anonymous_to_peers": false,
"parent_id": {
"$oid": "52c63278100c07c0d1000028"
},
"author_id": "2655027",
"comment_thread_id": {
"$oid": "52c4f303b03c4aba51000013"
},
"author_username": "dmoronta",
"sk": "52c63278100c07c0d1000028-52d0a66bcb3eee318d000012",
"updated_at": {
"$date": 1389405803386
},
"created_at": {
"$date": 1389405803386
}
}{
"_id": {
"$oid": "52ceea0cada002b72c000059"
},
"votes": {
"up": [
],
"down": [
],
"up_count": 0,
"down_count": 0,
"count": 0,
"point": 0
},
"visible": true,
"abuse_flaggers": [
],
"historical_abuse_flaggers": [
],
"parent_ids": [
{
"$oid": "5287e8d5906c42f5aa000013"
}
],
"at_position_list": [
],
"body": "if u please send by mail \n",
"course_id": "DelftX/CTB3365x/2013_Fall",
"_type": "Comment",
"endorsed": false,
"anonymous": false,
"anonymous_to_peers": false,
"parent_id": {
"$oid": "5287e8d5906c42f5aa000013"
},
"author_id": "2276302",
"comment_thread_id": {
"$oid": "528674d784179607d0000011"
},
"author_username": "totah1993",
"sk": "5287e8d5906c42f5aa000013-52ceea0cada002b72c000059",
"updated_at": {
"$date": 1389292044203
},
"created_at": {
"$date": 1389292044203
}
}
는 소스가 MongoDB를 보인다. MongoDB는 CSV 또는 유효한 JSON 배열로 내보낼 수 있습니다 (mongoexport의'--jsonArray' 플래그 사용). 어쩌면 상대방이 이러한 옵션을 사용할 수 있습니까? – Sebastian
예 ... 가능할지 모르지만 통신이 매우 느립니다. 그리고 그들이 예외를 만들지는 모르겠지만 어쨌든 물어볼 수 있습니다. 제안 주셔서 감사합니다, 나는 확실히 시도 할 것입니다. 덕분에 –