text-processing

    0

    1답변

    this에서 text1.similar ("괴물") 및 text1.concordance ("괴물")를 읽었습니다. 여기서 파이썬의 자연 언어 처리 툴킷의 text1.concordance('monstrous')과 text1.similar('monstrous')의 차이점에 대한 만족스러운 대답을 얻을 수 없습니다. 예를 들어 자세히 설명해 주시겠습니까?

    0

    1답변

    대부분 re.sub() 명령 인 텍스트 처리를 시도하고 있습니다. 문자열을 변경할 수는 없지만 문자열을 목록으로 변환하고 요소별로 변경하려고해도 출력에는 변화가 없습니다. 내가 알고 싶은 것은 : a) 내 코드가 잘못되어 가고 b) 목록보다는 bytearray를 사용하는 것이 더 낫겠습니까? with open("responses_test.txt", "r+"

    0

    1답변

    복수 파일에 대해 head() 기능을 어떻게 동시에 사용할 수 있습니까? 다음 스크립트는 작동하지 않습니다. head(c(mtcars, airquality)) $mpg [1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.2 10.4 10.4 [17] 14.7 32.4 30.

    2

    1답변

    NLTK의 CategorizedPlainCorpusReader에서 벵골어 텍스트를 읽고 싶습니다. 숭고한 텍스트 편집기에서 파일의 스냅 샷 : gedit 텍스트 편집기에서 내 벵골어 텍스트 파일의 스냅 샷 스냅 샷에서 당신은 문제를 볼 수 있습니다. 문제는 유니 코드 구성 문제입니다 (점선으로 표시된 반지는 죽은 공짜입니다). >>> path = os.pa

    -1

    1답변

    열 1에 다른 값이있는 것처럼 많은 파일을 원하지는 않지만 비슷한 질문을 신중히 인용합니다. here 예를 들어, from : A.B|100|20 A.B|101|20 A.X|101|30 A.X|1000|20 B.Y|1|1 B.Y|1|2 각 파일에 최대 5 줄까지 포함 된 x 파일로 분할하고 싶습니다. 예에서, 내가이 개 파일을 원하는 것 : A

    0

    1답변

    행렬을 만들려고합니다. 다음은 R 코드 matrix = create_matrix(tweets[,1], toLower = TRUE, language="english", removeStopwords=FALSE, removeNumbers=TRUE, stemWords=TRUE) : 나는 매트릭스의 대문자와 단어가 발언 lib

    1

    2답변

    파이썬에서이 간단한 텍스트 수정을 수행하는 깨끗한 방법은 무엇입니까? 마지막 스톱을 제외하고 모든 스톱에 공백이 오는 지 확인하십시오. 공백이 뒤 따르지 않는 점이 입력 문자열에서 얻을 수있는 유일한 오류라고 가정합니다. 나는이 일을하고있다 :이 def textFix(text): result = re.sub('\.(?!\s)', '. ', text

    0

    3답변

    몇 줄의 변수가 있습니다. 변수의 내용에서 마지막 줄을 제거하고 싶습니다. 인터넷에서 검색했지만 모든 링크는 파일에서 마지막 줄을 제거하는 것에 대해 이야기합니다. 여기의 내용을 내 변수 $echo $var $select key from table_test UNION ALL select fob from table_test UNION ALL sele

    1

    1답변

    TXR에서 재귀 패턴 일치 기능을 작성하는 방법을 이해하는 데 문제가 있습니다. 아래에서는 파일 경로를 인식하기위한 재귀 적 지시문을 정의하려고합니다. 이 경우 정규식 ([a-z]+\/)+[a-z]+을 사용하여이 문법을 나타낼 수 있지만이 규칙의 이점을 누릴 수있는 실제 코드는 더 복잡한 규칙을 염두에두고 있습니다. 슬래시가있을 때이 지시문의 실패 원인은

    1

    2답변

    을 존중 데이터에 쉼표를 선도 내가 좋아하는 많은 데이터를 가지고 다음 There are many ways data could be missing. An entire interior column could be missing. [missing/data/inside] a,b,c 1,,3 1,,4 3,,2 An indented data wit