bzip2

    6

    2답변

    위키피디아 데이터 덤프 (bz2 형식으로 압축)에 대한 연구를하기 위해 Hadoop Map Reduce를 사용하고 있습니다. 이 덤프는 너무 크기 때문에 (5T), xml 데이터를 HDFS로 압축 해제 할 수 없으며 hadoop이 제공하는 StreamXmlRecordReader를 사용합니다. Hadoop은 bz2 파일의 압축을 지원하지만 페이지를 임의로 분

    4

    2답변

    6GB bz2 파일의 중간에서 데이터를 추출하는 Python 프로그램을 작성하고 있습니다. bzip2 파일은 독립적으로 해독 할 수있는 데이터 블록으로 구성되어 있으므로 블록을 찾고 (마술 비트로 구분) 메모리에서 임시 블록 하나의 bzip2 파일을 만든 다음 마지막으로 bz2.decompress 기능. 진정해? bzip2 format에는 끝에 해당 파일에

    3

    2답변

    나는 약 200,000 개의 텍스트 파일이 bz2 파일에 있습니다. 내가 가지고있는 문제는 필자가 필요한 데이터를 추출하기 위해 bz2 파일을 스캔 할 때 매우 느리게 진행된다는 것입니다. 그것은 내가 찾고있는 하나의 파일을 잘하기 위해 전체 bz2 파일을 조사해야합니다. 이 속도를 높이려면 어쨌든 가나 요? 또한 tar.bz2에서 파일을 구성하는 방법에

    -4

    1답변

    BZip2 코드를 C에 통합하여 버퍼에로드 된 파일의 압축을 해제하려면 어떻게해야합니까? 저는 지난 3 개월 동안 C에서 시작 했으므로 자세한 내용을 제공해주십시오.

    0

    3답변

    2 개의 bzip2'ed 파일을 병합하고 싶습니다. 나는이 파일을 Hadoop 입력 파일로 사용하려고하는데, 손상된 블록에 대한 에러가 발생한다. (이 파일은 올바르게 압축 해제되었다.) cat file1.bzip2 file2.bzip2 > out.bzip2이 작동하는 것처럼 보였다. 2 개의 bzip2'ed 파일을 압축 해제하지 않고 병합하는 가장 좋은

    1

    2답변

    파일 이름을 지정하는 bzcat의 출력을 읽는 방법 그 디렉토리, 그리고 내가 공유 시스템에 있다고 생각하면, 인라인 bzcat을 포함하려고 노력하고 있지만 아무것도 작동하지 않는 것 같습니다. 나는 성공하지 못한 다음 조합들을 시도했다 : last -f <"$(bzcat /var/log/wtmp-*)" last -f <$(bzcat /var/log/wt

    6

    1답변

    안녕하세요. Boost.IOstreams를 사용하여 bzip2 파일에 데이터를 저장하고 싶습니다. void test_bzip() { namespace BI = boost::iostreams; { string fname="test.bz2"; { BI::filtering_stream<BI::bidirectional> my_filter;

    1

    1답변

    pythons bz2compressor 클래스를 사용하여 데이터 스트림을 압축하려고합니다. 문서는 bz2compressor.compress()가 압축 된 데이터의 덩어리를 반환해야 "가능한"하지만 난 아무것도 을하지 않습니다 말한다 내 모든 압축 된 데이터 I flush() (I 파일 2기가바이트 +로 시도) 아직 아무것도 얻을. 데이터를 반환해야하는 경우

    7

    2답변

    Bzip2 보관 파일을 만들어야합니다. A는 'Apache ant'에서 bzip2 라이브러리를 다운로드했습니다. I use class CBZip2OutputStream: String s = ..... CBZip2OutputStream os = new CBZip2OutputStream(fos); os.write(s.getBytes(Chars

    19

    1답변

    나는 ZIP, GZIP, 및 RAR 파일을 압축 해제 할 수 있지만, 나는 또한 레스 햇의 bzip2 파일의 압축을 해제뿐만 아니라 그들 (.tar가) 보관 해제해야합니다. 나는 사용할 좋은 도서관을 찾지 못했습니다. 내가 그렇게 이상적으로 메이븐과 함께 자바를 사용하고 , 나는 POM의 종속성을 포함하고 싶습니다. 무슨 라이브러리를 권장합니까? 내가 볼