2013-06-24 2 views
-1

내 웹 앱 중 하나는 많은 기사 제출을 받았으며 일부는 잘 작성되지 않았습니다. 좋고 나쁜 기사들의 모음을 제공함으로써 "좋은"대 "나쁜"글을 인식하는 도구를 만드는 것이 가능한가?교훈 작성 알고리즘 (Python)

이 기사 (적어도 이미 처리 된 기사)는 검토 및 채점되었으므로 이론적으로이 숫자를 사용하여 출력을 확인할 수 있습니다.

"학습"알고리즘을 만드는 데 배경 지식이 없기 때문에 주제에 대한 기초적인 책을 가리키는 포인터 만 유용 할 수 있습니다. 특히 파이썬 언어로 작성된 포인터가 유용합니다.

+3

자연어는 매우 복잡합니다. 대형 NLP 라이브러리없이 작성할 수있는 도구는 매우 유용 할 것입니다. 읽을 거리가 너무 많습니다. –

+0

좋은 도구를 식별 할 수있는 도구가 존재한다면 소프트웨어는 잠재적으로 인기있는 책을 쓸 수 있습니다. – suspectus

+0

우리는 사람의 평론가가 있지만, 평론가의 가치가있는 사람 만 제외하면 좋을 것입니다. 또한 우리는 약 50k + 기사의 디지털 도서관을 보유하고 있으며 그 중 일부는 다양한 출처에서 온 것이므로 점수가 매겨지지 않습니다. 누군가가 주어진 주제와 관련된 논문을 찾으려고한다면, 가장 좋은 기사를 먼저 다루는 것이 유용 할 것입니다. –

답변

1

나는 이것이 어려운 학습 알고리즘이 될 것이라고 생각한다. 그러나, 만약 당신이 가고 싶거나 그냥 주제에 대해 배우고 관심이 Coursera는 체크 아웃 가치가 무료 온라인 강좌의 번호를 제공합니다.

이 과정은 현재 등 과제에 대한 실행되지 않지만, 내가 본 것을이 초보자에 적합에서 당신은 미리보기 모드에서 강의를 볼 수 있습니다 : https://class.coursera.org/machlearning-001/lecture/preview

당신이 다음 연습을 원하는 경우에 나는 것 데이터 과학/기계 학습 문제에 대한 공개 경쟁을 벌이는 Kaggle (http://www.kaggle.com/)을 살펴 보는 것이 좋습니다. 일부 경연 대회에는 시작을위한 샘플 코드가 포함되어 있습니다. 타이타닉 경쟁은 문제가 제안한 문제보다 훨씬 간단하지만 Python에서 일부 샘플 코드가 있습니다.

+0

Kaggle에게 공개 경쟁으로이 문제를 제기 한 적이 있습니까? 분명히 이렇게하려면 데이터를 공개 할 준비가 필요합니다. – ChrisProsser

관련 문제