2011-01-03 5 views
1

우분투에서 파이썬을 사용하여 파일과 연결된 메타 데이터 목록을 가져 오려고합니다.우분투에서 파이썬을 사용하여 파일과 관련된 메타 데이터 목록 가져 오기

"추출"명령은 매우 잘 작동하지만 파이썬과 함께 사용하는 방법을 모르지만 항상 "추출"이 정의되어 있지 않다는 메시지가 나타납니다.

+2

어떤 OS :

# Assuming 'property_reader.py' is the name of the module/file in which you saved Tim Golden's code... import property_reader propgenerator = property_reader.property_sets('[your file path]') for name, properties in propgenerator: print name for k, v in properties.items(): print " ", k, "=>", v 

위의 코드의 출력은 다음과 같은 것인가? Windows, Linux, ?? – marcog

+0

정확하게 파이썬에서 어떻게 사용하려고합니까? – martineau

답변

0

Windows를 사용하는 경우 귀하의 질문은 이미 SO으로 해결되었습니다.

+0

답변이 아닌 댓글로 게시해야합니다. – marcog

+1

아니, 실제로 우분투를 사용하고 있습니다 – mimou

1

extractlibextractor 라이브러리를 기반으로합니다. Ubuntu에 python-extractor 패키지를 설치하면 파이썬에서 라이브러리에 액세스 할 수 있습니다.

4

"요약"탭의 Windows "속성"대화 상자에 나타나는 메타 데이터에 대해 묻는 것으로 가정합니다. (그렇지 않다면 이것을 무시하십시오.) 내가 관리 한 방법은 다음과 같습니다.

  1. Python win32 extensions을 다운로드하여 설치하십시오. 그러면 win32, win32com 등을 Python [ver]/Lib/site-packages 폴더에 넣을 수 있습니다. 이것들은 win32api, win32com 등을 가지고 있습니다. 어떤 이유인지 모르겠지만, 파이썬 2.6 (빌드 216) 버전을 작동시키지 못했습니다. 내 시스템을 파이썬 2.7로 업데이트하고 파이썬 2.7 용 216 빌드를 사용했다. (& 설치하려면 위의 링크를 따라 'pywin32'링크를 클릭하고 최신 빌드 (현재 216) 링크를 클릭하고 시스템 및 파이썬 설치와 일치하는 .exe 파일 링크를 클릭하십시오. pywin32-216.win32-py2.7.exe) .exe 파일을 실행하십시오.
  2. Tim Golden의 자습서에있는 코드의 코드 "Get document summary information"을 복사하여 컴퓨터의 .py 파일에 붙여 넣으십시오.
  3. 꼬집음 코드. 코드를 수정해야 할 필요는 없지만이 Tim 스크립트를 기본 모듈로 실행하고 첫 번째 sys.argv로 경로 이름을 제공하지 않으면 오류가 발생합니다. 미세 조정하려면 코드 맨 아래로 스크롤하고 if __name__ == '__main__':으로 시작하는 마지막 블록을 생략하십시오.

property_reader.py과 같은 파일을 저장하고 property_sets(filepath) 메서드를 호출하십시오. 이 메서드는 생성자 객체를 반환합니다. 생성기를 반복하여 모든 속성과 값을 볼 수 있습니다. 이처럼 구현할 수 :

DocSummaryInformation 
    PIDDSI_CATEGORY => qux 
SummaryInformation 
    PIDSI_TITLE => foo 
    PIDSI_COMMENTS => flam 
    PIDSI_AUTHOR => baz 
    PIDSI_KEYWORDS => flim 
    PIDSI_SUBJECT => bar 
관련 문제