word-count

    1

    1답변

    단어 수의 특정 단어를 검색 할 매크로 솔루션을 찾고 있습니다. 나는 그 단어에 갈 수 있기를 원한다. (나는 책 길이의 원고로 작업한다) 문서에서 23,050 단어까지있다. 정상적인 go-to 명령은 한 줄 또는 한 페이지지만 한 단어가 아닙니다. 어떤 아이디어?

    0

    2답변

    최근에 hadoop 1.1.2를 학습하기 시작했습니다. WordCount 케이스를 실행하기 시작하면 두 종류의 코드가 모두 정상입니다. 명령 A : hadoop jar /usr/local/hadoop/hadoop-examples-1.1.2.jar WordCount input output 명령 B는 : hadoop jar /usr/local/hadoop/

    2

    2답변

    일반적으로 Hadoop 예제는 파일 또는 여러 파일의 단어 수를 계산하는 방법을 정의합니다. 단어 수의 결과는 전체 집합에서 나옵니다. 나는 각 문단에 대한 단어 수를 으로하고 paragh (i) _wordcnt.txt와 같은 별도의 파일로 저장하려고합니다. 어떻게해야합니까? (이 문제는 전체 집합에 대한 매퍼 실행하고 감속기는 마지막으로 출력을 수집 은

    0

    2답변

    hadoop에서 첫 번째 프로그램을 실행할 때이 예외가 발생합니다. (나는 0.20.2 버전에서 hadoop 새로운 API를 사용하고있다). 웹에서 검색 한 결과 대부분의 사람들이 MapperClass 및 ReducerClass를 구성 논리에 설정하지 않았을 때이 문제에 직면 한 것처럼 보였습니다. 하지만 확인하고 코드가 괜찮아 보이는군요. 누군가가 나를

    2

    1답변

    나는 hadoop에 새로 왔습니다. 나는 단어 수로 끝내었고 지금 나는 수정을하고 싶다. 텍스트 파일에서 가장 많이 발생한 단어를 가져오고 싶습니다. a 1 b 4 c 2 I 출력을 나에게 여기 만 b 4 내 감속기 기능 :: public static class Reduce extends Reducer<Text, IntWritable, Text,

    0

    1답변

    현재 WordCounter (MapReduce)를 작성 중입니다. 내가 intermediateMap 변수를 사용 map<string, vector<int> > WordMap; : 나는 또한 문자열과 vectory 데이터 구성 요소가있는지도 인 된 resultMap을 사용 void WordCounter::Reduce(string intermediateWo

    1

    4답변

    어쩌면 이것은 어리석은 질문 일지 모르지만, 파이썬으로 가장 자주 나오는 단어 10 개를 추출하는 데 문제가 있습니다. 이것은 내가 지금까지 가지고있는 것이다. 뒤에 import re import string from nltk.corpus import stopwords stoplist = stopwords.words('dutch') from col

    0

    5답변

    내 CS 최종 연습을하고 있는데, 문자열을 읽고, 사용자로부터 최소 길이를 얻어야하며, 적어도이 많은 편지. 마치 내 코드가 괜찮은 것처럼 보이지만 대답을 인쇄 할 수 없습니다. 누구든지 나를 도울 수 있습니까? while 루프가 무한히 실행되는 것처럼 보이지만 그 이유는 알 수 없습니다!

    1

    4답변

    프로그램에서 이전에 파일에 입력 한 항목을 계산하여 텍스트 파일의 항목 수를 계산하려고합니다. 이미 파일과 텍스트 상자에서 읽은 텍스트가 있습니다. 문제는 현재 코드가 텍스트 상자의 문자를 계산하는 것이지 원하는 단어가 파일에없는 횟수를 계산하는 것이 아니라는 것입니다. For Each desiredword As String In txtContentofFi

    1

    1답변

    잠긴 PDF 파일에서 특정 단어를 어떻게 집계 할 수 있습니까? 여기 연례 보고서에 대해 이야기하고 있습니다. 당신은 안으로 검색 할 수 있지만, 그것을 밖으로 복사 할 수 없습니다 (어떤 이유로, 나던 이해가). 영원히 인터넷 검색 후, 난 여전히 해결책을 발견 havent 한. 파일은 텍스트 (뿐 아니라 스캔 한 이미지) 및 사용 된 글꼴이 포함되어있는