나는 블로그와 뉴스 웹 사이트의 대규모 컬렉션에 대한 액세스를 제공하는 서비스에서 전체 HTML을 수집합니다. 나는 (실시간으로) HTML이 몇 가지 키워드를 포함하는지 확인하기 위해 HTML을 검사하고있다. 여기에 키워드 중 하나가 포함되어 있으면 HTML을 텍스트 파일에 작성하여 저장합니다.자바 텍스트 파일 크기 (파일이 닫히기 전에)
일주일 동안하고 싶습니다. 따라서 많은 양의 데이터를 수집하고 있습니다. 3 분 동안 프로그램을 테스트하면 100MB의 텍스트 파일이 생성되었습니다. 4 TB의 공간이 있으며 이보다 더 많은 공간을 사용할 수 없습니다.
또한 텍스트 파일이 너무 커지는 것을 원치 않습니다. 왜냐하면 내가 열 수 없게 될 것이라고 생각하기 때문입니다.
내가 제안하는 것은 텍스트 파일을 열고 HTML을 작성하여 크기를 자주 확인하는 것입니다. 200MB보다 크면 텍스트 파일을 닫고 다른 파일을 엽니 다. 또한 총 공간에서 사용한 공간의 로그를 유지해야하므로 4TB에 가깝지 않도록 할 수 있습니다.
이 시점에서 내가 가진 질문은 파일이 닫히기 전에 (FileWriter.close() 사용) 텍스트 파일의 크기를 확인하는 방법입니다. 이 기능이 있습니까? 아니면 파일에 기록 된 문자 수를 계산하여 파일 크기를 예측하는 데 사용해야합니까?
별도의 질문 : 텍스트 파일의 공간을 최소화하는 방법이 있습니까? 나는 자바에서 일하고있다.
별도의 질문은 실제로는 별도의 질문이어야합니다. – beny23