접두사를 기반으로 함께 일치하는 여러 DF를 병합합니다. 의미 상으로 정확한 문자열을 생성하는 데는 90 %의 시간이 걸리지 만 때로는 이러한 방식으로 병합하면 함께 루프하는 구문을 만들 수 있습니다. 여기에 더 나은 무슨 뜻인지 설명 할 것이다처럼 내 DF는 모습의 예입니다 : 열이 내DF에서 중복 단어가 포함 된 문구 제거 (Pandas, Python3)
Words Words1 Words2
Big Hitter Up and Down A Cold Lonely Night
Snail Mail Wood Grain Rail Cup of Lemon Tea
.... ..... .....
French Fries Bat Boy Bat Small Ball Small Ball
Phone Book Fee No Fee Hands up Hands up
하단 두 가지 예를 3 나는 그들이 "함께 루프"를 말할 때 내 말은 무엇을 - IE의 문자열에 같은 단어의 중복이 들어 있습니다.
나는re.sub(r'\b(.+)(\s+\1\b)+', r'\1', s)
사용하여 이러한 문구를 중복 제거하는 방법을 알고하지만 난 그들이 완전히 사라해야합니다. 누구든지 내 DF의 각 열에서 중복 된 단어가 포함 된 문자열을 제거하는 방법을 알고 있습니까?
그래서 나는
Words Words1 Words2
Big Hitter Up and Down A Cold Lonely Night
Snail Mail Wood Grain Rail Cup of Lemon Tea
.... ..... .....
French Fries
Phone Book
안녕하세요 CT -이 오류가 계속 발생합니다 : AttributeError : (" 'float'객체에 'split'"속성이 없으며 색인 단어에서 발생했습니다.) 어떤 아이디어입니까? – user3682157
모든 열이'string'입니까? –
그걸 알아 냈고 해결책이 효과가 있습니다 - 어떻게 작동하는지에 대해 좀 더 자세히 설명해 주시겠습니까? 고맙습니다! – user3682157