2016-08-15 3 views
-3

필자는 수행해야 할 다소 까다로운 파일 조작법을 사용하고 있지만 필자는 코딩에 다소 나빴다. 도움이 될 것입니다, 그래서 미리 감사드립니다. 가급적 쉘 또는 파이썬에서 나는 그들이 내가 이해할 수있는 다른 언어로 된 쉬운 해결책이있다하더라도 필자가 알고있는 언어이다. 복잡한 파일/텍스트 조작


나는 그러나 올바르게 어려운 데이터와 일치 할 수있는 자신의 열이 정렬되지 않은, 상관 관계 정보로 2 개 대규모 파일이 있습니다. 사물을 더 복잡하게하기 위해, 소수점 앞에 값만있는 경우에도 소수점 뒤에 값이 다양합니다.

  • 읽기 file1, column1, row1하지만 소수점 후 모든 값을 무시 :

    그래서 내가 무엇을해야하는지.

  • file1에서 가져온 값에 대해 file2 및 검색 column1을 읽은 다음 다시 소수점을 무시하면 무시하십시오.

  • file2에서 상관 값을 찾았 으면이 두 줄을 각각의 줄에서 나머지 데이터와 함께 새 파일 (file3)로 출력하십시오.

그건 단계 하나입니다. 누군가가 저를 도울 수 있다면 크게 감사하겠습니다. 다음 단계는이 프로세스에 루프를 적용하여 file1, line2으로 이동하고 프로세스를 반복하는 것입니다.

+0

오히려 비관적이기보다는 쉽게 시작 장소를 제안 할 수 있습니다. 당신이하고있는 일을 모를 때 사용하기 어려운 튜토리얼 종류. 도움이되어 주셔서 감사합니다. – Vlad

+1

@Vlad : 나는 Shell에서하지 않는 것이 좋습니다 **. 저는 개인적으로 루비에 글을 쓸 것입니다. 그러나 이것은 제 개인적인 취향입니다. 파이썬이나 펄은 똑같이 잘 할 수있다. – user1934428

답변

1

여러분은 지금 알고있는 것보다 더 잘 파이썬을 배워야 할 것입니다. 여기 당신이해야 할 일 개요가 있습니다. 이러한 종류의 "파일 조작"은 매우 일반적입니다. (파일이 동일한 형식이없는 경우 또는 두 개의 정규 표현식)

  1. file1file2에서 라인과 일치하는 정규 표현식을 확인합니다. 정규 표현식에 중요한 그룹을 캡처하는 구문을 포함하십시오.
  2. file1을 한 줄씩 읽습니다.
  3. 각 행을 읽을 때 정규 표현식과 일치시키고 중요한 그룹을 찾아 해시에 저장하십시오.
  4. 지금은 라인별로 file2을 읽습니다.
  5. 각 행을 읽을 때 정규 표현식과 일치시키고 중요한 그룹을 찾은 다음 해시를 검색하여 일치하는 항목을 찾으십시오.
  6. 일치 항목을 찾으면 file3
  7. 으로 돌아가서 4 단계로 돌아가서 반복하십시오.