2011-05-09 3 views
1

업데이트 : 대답의 링크는 흥미롭고 유용하지만 불행히도 자바 API에 대한 필요성을 언급하지 않으므로 여전히 모든 입력을 기다리고 있습니다.pubchemdb를 사용한 사람이 있습니까? 비슷한 API?

저는 화학 물질 데이터베이스를 구축 중입니다. 모든 동의어 (IUPAC 및 일반 이름)와 각각의 안전 데이터가 필요합니다. 내가 PubChem에서 무료로 사용할 수있는 데이터를 (http://pubchem.ncbi.nlm.nih.gov/)

사용됩니다
간단한 HTTP 가져 각 화합물 질의의 쉬운 방법이있다.

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753 

그리고 다음 URL은 쉬운 형식으로 구문 분석 반환 : 예를 들어, 글리세롤 데이터를 얻기 위해, URL은

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753&disopt=DisplaySDF 

하지만 안전 데이터 부족, 매우 기본적인 정보를 응답합니다 그리고 단지 몇 가지 일반적인 이름.

스크립스 (citation) 그룹이 개발 한 JAVA 용 공개 도메인 API가 매우 완전하게 보입니다. 코드는 here입니다.

이 API는 문서화가 잘되어 있지 않아 관련 데이터의 복잡성으로 인해 따라하기가 어렵습니다. 내가 수집 한 내용에 대해 pubchemdb는 PubChem Power User Gateway (PUG) XML API

누구든지이 API를 사용 했습니까? 시작하는 방법에 대한 간단한 설명이나 자습서에 감사드립니다.

+0

이것은 아마도 StackOverflow의 전문가입니다. 당신이 시도해 볼 수있는 문화 정보학 커뮤니티가 있습니까? –

+0

@Tom 아주 전문화되어 있을지 모르지만, 나는이 데이터베이스를 사용하는 누군가가 이곳에서 일하기를 희망합니다. 여기에는 몇 가지 질문에 대한 답변이 있습니다. 저자에게 직접 연락 할 수도 있습니다. – Aleadam

+0

글쎄, 나는 살고 배우고! –

답변

2

Cactvs Chemoinformatics toolkit (학업/교육용 무료)에는 전체 PubChem 통합이 있습니다. 스크립팅 환경을 사용하면 쉽게

 
cactvs>ens create 753 

ens0 

cactvs>ens get ens0 E_NAMESET 

PROPANE-1,2,3-TRIOL GLYCEROL 8043-29-6 29796-42-7 30049-52-6 37228-54-9 75398-78-6 78630-16-7 8013-25-0 175385-78-1 25618-55-7 64333-26-2 56-81-5 {Tegin M} LS-1377 G8773_SIGMA 15523_RIEDEL {Glycerin, natural} NCGC00090950-03 191612_ALDRICH 15524_RIEDEL {Glycerol solution} L-glycerol 49767_FLUKA {Biodiesel impurity} 49770_FLUKA 49771_FLUKA NCGC00090950-01 49927_FLUKA Glycerol-Gelatine G7757_SIAL GOL D-glycerol G9012_SIAL {Polyhydric alcohols} c0066 MOON {NSC 9230} G2025_SIGMA ZINC00895048 49781_FLUKA {Concentrated glycerin} {Concentrated glycerin (JP15)} D00028 {Glycerin (JP15/USP)} 44892U_SUPELCO {Glycerin, concentrated (JAN)} CRY 49782_FLUKA NCGC00090950-02 G6279_SIAL W252506_ALDRICH G7893_SIAL {Glycerin, concentrated} 33224_RIEDEL Bulbold Cristal Glyceol G9281_SIGMA Glycerol-1,2,3-3H G1901_SIGMA G7043_SIGMA 1,2,3-trihydroxypropane 1,2,3-trihydroxypropanol glycerin G2289_SIAL G9406_SIGMA {Glycerol-[2-3H]} CHEBI:17754 Glyzerin Oelsuess InChI=1/C3H8O3/c4-1-3(6)2-5/h3-6H,1-2H {90 Technical glycerine} Dagralax {Glycerin, anhydrous} {Glycerin, synthetic} Glycerine Glyceritol {Glycyl alcohol} Glyrol Glysanin NSC9230 Ophthalgan Osmoglyn Propanetriol {Synthetic glycerin} {Synthetic glycerine} Trihydroxypropane Vitrosupos {WLN: Q1YQ1Q} Glycerol-1,3-14C {4-01-00-02751 (Beilstein Handbook Reference)} AI3-00091 {BRN 0635685} {CCRIS 2295} {Caswell No. 469} {Citifluor AF 2} {Clyzerin, wasserfrei [German]} {EINECS 200-289-5} {EPA Pesticide Chemical Code 063507} {FEMA No. 2525} {Glicerina [DCIT]} {Glicerol [INN-Spanish]} {Glycerin (mist)} {Glycerin [JAN]} {Glycerin mist} {Glycerine mist} Glycerinum {Glycerolum [INN-Latin]} Grocolene {HSDB 492} IFP {Incorporation factor} 1,2,3-Propanetriol C00116 Optim {Propanetriol (VAN)} {1,2,3-PROPANETRIOL, HOMOPOLYMER} {Glycerol polymer} {Glycerol, polymers} {HL 80} {PGL 300} {PGL 500} {PGL 700} Polyglycerin Polyglycerine Polyglycerol {Unigly G 2} {Unigly G 6} G5516_SIGMA MolMap_000024 

cactvs> 

이 모든 PUG의 추함을 숨 깁니다처럼 뭔가를 할 수 -하지만 어떤 경우에, 그 PUG 이 잘 설명되어 감히. 툴킷은 단순한 데이터 다운로드를 훨씬 능가합니다. 원하는 경우 PubChem을 로컬 SD 파일처럼 열어 쿼리 할 수도 있습니다.

PubChem에는 안전성 데이터가 없습니다. 안전 데이터는 국가/지역에 따라 다르며 엄격하게 규제되며, 부채에 부딪치지 않도록주의해야합니다. 법률 담당자가 귀하의 접근 방식을 점검하십시오!

+0

답장을 보내 주셔서 감사합니다. 나는 cactvs pdf 문서를 다운로드했고 나는 그것을 검토 할 것이다. 그것은 매우 흥미 보입니다. – Aleadam

관련 문제