2016-06-18 1 views
0

Java 데이터 흐름 코드를 호출하기 위해 C++ 실행 파일 (및 실행 파일로 컴파일해야하는 소스 코드)이 있습니다. 그게 가능하니? 그렇다면 데이터 흐름에서 사용하는 가상 컴퓨터에 C++ 코드를 설치하고 컴파일하는 방법과 데이터 흐름에 이러한 특정 가상 컴퓨터를 사용하도록 알리는 방법은 무엇입니까? 또한 Java 코드가 필요할 경우 디스크에 기록 할 수 있습니까 (예 : RAM에 저장할 수없는 엄청나게 큰 개체가 있으므로 일부 처리 중에 일시적으로 디스크에 저장해야 함). (일반적으로 Google 클라우드 데이터 흐름 분산 아키텍처의 코드를 다시 작성해야한다는 것을 알고 있지만, 특정 상황에서는 단기간에 특정 시스템이 사용하기 쉽고 특정 라이브러리가 이미 작성되어 있기 때문에 특정 용도로만 디스크에 쓸 수 있습니다. 등)커스텀 C++ 코드를 실행하고 디스크에 쓸 수 있습니까?

답변

1

예, 다른 바이너리를 실행하거나 JNI를 사용하여 Dataflow에서 C++ 코드를 호출 할 수 있습니다. --filesToStage 옵션을 사용하여 원하는 파일을 작업자 VM에 준비한 다음 작업자 VM에서 사용할 수 있습니다. --filesToStage에 전달한 목록에서 Java 코드를 실행하는 데 필요한 모든 병을 포함시켜야합니다.

작업자 모두 디스크를 가지고 있기 때문에이를 사용할 수도 있습니다. 특정 작업자의 존재 기간에 대한 보장이 없으므로 디스크는 단일 번들에 대해서만 보장됩니다. 일시적으로 데이터를 버퍼링하기 만하면되기 때문에 괜찮습니다.

관련 문제