2013-07-26 2 views
-2

큰 데이터 세트가 있으며 원형 차트로 표시해야합니다. 그래서 25 번째 첫 번째 행을 선택하고 새로운 레이블 (예 : "others")에서 모든 휴지 행을 합산하는 방법을 찾고 있습니다. 데이터는 다음과 같습니다R : 원형 차트를 나타내는 행 합치기

23527 Streptococcaceae  0.19 
13871 Neisseriaceae  0.11 
7197 Enterobacteriaceae 0.06 
6914 Pasteurellaceae  0.06 
5141 Actinomycetaceae  0.04 
4970 Corynebacteriaceae 0.04 
4010 Veillonellaceae  0.03 
3263 Lactobacillaceae  0.03 
3178 Burkholderiaceae  0.03 
2753 Mycobacteriaceae  0.02 
2574 Streptomycetaceae 0.02 
2330 Bacillaceae   0.02 
2008 Micrococcaceae  0.02 
1952 Vibrionaceae   0.02 
1606 Enterococcaceae  0.01 
1382 Pseudomonadaceae  0.01 
1261 Flavobacteriaceae 0.01 
1243 Clostridiaceae  0.01 
1218 Bifidobacteriaceae 0.01 
1114 Nocardiaceae   0.01 
1104 Propionibacteriaceae 0.01 
1076 Prevotellaceae  0.01 
[...] 

첫 번째 행이 단어를 표시 횟수의 카운트이며, 세 번째는 카운트의 상대 백분율이다. 나는 이런 식으로 뭔가 좀하고 싶습니다 :

23527 Streptococcaceae  0.19 
13871 Neisseriaceae  0.11 
7197 Enterobacteriaceae 0.06 
6914 Pasteurellaceae  0.06 
5141 Actinomycetaceae  0.04 
4970 Corynebacteriaceae 0.04 
4010 Veillonellaceae  0.03 
3263 Lactobacillaceae  0.03 
3178 Burkholderiaceae  0.03 
2753 Mycobacteriaceae  0.02 
2574 Streptomycetaceae 0.02 
2330 Bacillaceae   0.02 
2008 Micrococcaceae  0.02 
3000 Others    0.12 

는 R에서이 작업을 수행하는 것이 가능하거나 그 일의 더 좋은 방법은 무엇입니까? 미리 감사드립니다!

(EDIT)

전체 코드 :

family <-as.data.frame (read.table ("Taxonomy_Family_info", sep="\t")) 
    piedat <- rbind(family[1:25, ], 
        as.data.frame(c(sum(family[26:nrow(family),1]), 
            "Others", 
            sum(family[26:nrow(family),3])))) 
    > dput(head(family,5)) 
structure(list(V1 = c(23527L, 13871L, 7197L, 6914L, 5141L), V2 = structure(c(359L, 
256L, 136L, 283L, 9L), .Label = c("- ", "Acetobacteraceae ", 
"Acholeplasmataceae ", "Acidaminococcaceae ", "Acidimicrobiaceae ", 
"Acidithiobacillaceae ", "Acidobacteriaceae ", "Acidothermaceae ", 
"Actinomycetaceae ", "Adoxaceae ", "Adrianichthyidae ", "Aerococcaceae ", 
"Aeromonadaceae ", "Ajellomycetaceae ", "Albuginaceae ", "Alcaligenaceae ", 
"Alcanivoracaceae ", "Alicyclobacillaceae ", "Alteromonadaceae ", 
"Amaranthaceae ", "Anacardiaceae ", "Anaerolineaceae ", "Anaplasmataceae ", 
"Anoplopomatidae ", "Anthelidae ", "Aphididae ", "Apidae ", 
"Aquificaceae ", "Araceae ", "Archaeoglobaceae ", "Arthrodermataceae ", 
"Ascarididae ", "Asteraceae ", "Aurantimonadaceae ", "Babesiidae ", 
"Bacillaceae ", "Bacteriovoracaceae ", "Bacteroidaceae ", 
"Balaenopteridae ", "Bangiaceae ", "Bartonellaceae ", "Beijerinckiaceae ", 
"Beutenbergiaceae ", "Bifidobacteriaceae ", "Blattabacteriaceae ", 
"Bombycidae ", "Bovidae ", "Brachyspiraceae ", "Braconidae ", 
"Bradyrhizobiaceae ", "Branchiostomidae ", "Brassicaceae ", 
"Brevibacteriaceae ", "Brucellaceae ", "Burkholderiaceae ", 
"Campylobacteraceae ", "Candidatus Brocadiaceae ", "Canellaceae ", 
"Canidae ", "Cardiobacteriaceae ", "Carnobacteriaceae ", "Catenulisporaceae ", 
"Caulerpaceae ", "Caulobacteraceae ", "Caviidae ", "Cebidae ", 
"Cellulomonadaceae ", "Cenarchaeaceae ", "Ceratobasidiaceae ", 
"Cercopithecidae ", "Chaetomiaceae ", "Chlamydiaceae ", "Chlamydomonadaceae ", 
"Chlorellaceae ", "Chlorobiaceae ", "Chloroflexaceae ", "Chromatiaceae ", 
"Chrysiogenaceae ", "Cichlidae ", "Cionidae ", "Clavicipitaceae ", 
"Clostridiaceae ", "Clostridiales Family XIII. Incertae Sedis ", 
"Clostridiales Family XI. Incertae Sedis ", "Clostridiales Family XVIII. Incertae Sedis ", 
"Clostridiales Family XVII. Incertae Sedis ", "Cobitidae ", 
"Codonosigidae ", "Colwelliaceae ", "Comamonadaceae ", "Conexibacteraceae ", 
"Cordycipitaceae ", "Coriobacteriaceae ", "Coriolaceae ", 
"Corynebacteriaceae ", "Coxiellaceae ", "Cricetidae ", "Cryomorphaceae ", 
"Cryptosporidiidae ", "Culicidae ", "Curculionidae ", "Cyanidiaceae ", 
"Cyclobacteriaceae ", "Cyprinidae ", "Cystobacteraceae ", 
"Cytophagaceae ", "Daphniidae ", "Dasyuridae ", "Debaryomycetaceae ", 
"Deferribacteraceae ", "Deinococcaceae ", "Deoclonidae ", 
"Dermabacteraceae ", "Dermacoccaceae ", "Dermatophilaceae ", 
"Desulfarculaceae ", "Desulfobacteraceae ", "Desulfobulbaceae ", 
"Desulfohalobiaceae ", "Desulfomicrobiaceae ", "Desulfovibrionaceae ", 
"Desulfurellaceae ", "Desulfurobacteriaceae ", "Desulfurococcaceae ", 
"Desulfuromonadaceae ", "Dictyoglomaceae ", "Didelphidae ", 
"Dietziaceae ", "Dipodascaceae ", "Drosophilidae ", "Ectocarpaceae ", 
"Ectothiorhodospiraceae ", "Edwardsiidae ", "Elephantidae ", 
"Elusimicrobiaceae ", "Enterobacteriaceae ", "Enterococcaceae ", 
"Entomoplasmataceae ", "Equidae ", "Erysipelotrichaceae ", 
"Erythrobacteraceae ", "Estrildidae ", "Eubacteriaceae ", 
"Euphorbiaceae ", "Euplotidae ", "Fabaceae ", "Ferrimonadaceae ", 
"Ferroplasmaceae ", "Fibrobacteraceae ", "Flammeovirgaceae ", 
"Flavobacteriaceae ", "Formicidae ", "Francisellaceae ", "Frankiaceae ", 
"Fucaceae ", "Funariaceae ", "Fusobacteriaceae ", "Galagidae ", 
"Gallionellaceae ", "Gemmatimonadaceae ", "Geobacteraceae ", 
"Geodermatophilaceae ", "Geometridae ", "Glomerellaceae ", 
"Glycomycetaceae ", "Gordoniaceae ", "Gracillariidae ", "Haematococcaceae ", 
"Hahellaceae ", "Halanaerobiaceae ", "Halobacteriaceae ", 
"Halobacteroidaceae ", "Halomonadaceae ", "Haloplasmataceae ", 
"Halothiobacillaceae ", "Harrimaniidae ", "Helicobacteraceae ", 
"Heliobacteriaceae ", "Heptageniidae ", "Herpetosiphonaceae ", 
"Herpotrichiellaceae ", "Hexamitidae ", "Holophagaceae ", 
"Hominidae ", "Hyacinthaceae ", "Hydridae ", "Hydrogenophilaceae ", 
"Hydrogenothermaceae ", "Hylobatidae ", "Hyphomicrobiaceae ", 
"Hyphomonadaceae ", "Hypocreaceae ", "Hypotrichomonadidae ", 
"Ictaluridae ", "Idiomarinaceae ", "Iguanidae ", "Intrasporangiaceae ", 
"Jonesiaceae ", "Juncaginaceae ", "Kineosporiaceae ", "Kofleriaceae ", 
"Ktedonobacteraceae ", "Lachnospiraceae ", "Lactobacillaceae ", 
"Lamiaceae ", "Lasiocampidae ", "Lasiosphaeriaceae ", "Legionellaceae ", 
"Lentisphaeraceae ", "Lepidoziaceae ", "Leporidae ", "Leptospiraceae ", 
"Leptotrichiaceae ", "Leuconostocaceae ", "Liliaceae ", "Listeriaceae ", 
"Marasmiaceae ", "Marattiaceae ", "Marinilabiaceae ", "Mariprofundaceae ", 
"Megachilidae ", "Melampsoraceae ", "Methanobacteriaceae ", 
"Methanocaldococcaceae ", "Methanocellaceae ", "Methanococcaceae ", 
"Methanocorpusculaceae ", "Methanomicrobiaceae ", "Methanopyraceae ", 
"Methanosaetaceae ", "Methanosarcinaceae ", "Methanospirillaceae ", 
"Methylacidiphilaceae ", "Methylobacteriaceae ", "Methylococcaceae ", 
"Methylocystaceae ", "Methylophilaceae ", "Metschnikowiaceae ", 
"Microbacteriaceae ", "Micrococcaceae ", "Micromonosporaceae ", 
"Montiaceae ", "Moraxellaceae ", "Moritellaceae ", "Muridae ", 
"Mycobacteriaceae ", "Mycoplasmataceae ", "Mycosphaerellaceae ", 
"Myoviridae ", "Myxococcaceae ", "Nakamurellaceae ", "Nannocystaceae ", 
"Natranaerobiaceae ", "Nautiliaceae ", "Nectriaceae ", "Neisseriaceae ", 
"Niphatidae ", "Nitrosomonadaceae ", "Nitrosopumilaceae ", 
"Nitrospiraceae ", "Nocardiaceae ", "Nocardioidaceae ", "Nocardiopsaceae ", 
"Noctuidae ", "Nostocaceae ", "Nymphalidae ", "Oceanospirillaceae ", 
"Onchocercidae ", "Oocystaceae ", "Opisthorchiidae ", "Opitutaceae ", 
"Orbiliaceae ", "Orchidaceae ", "Ornithorhynchidae ", "Orthodontiaceae ", 
"Oscillochloridaceae ", "Oscillospiraceae ", "Oxalobacteraceae ", 
"Paenibacillaceae ", "Parachlamydiaceae ", "Parmeliaceae ", 
"Parvularculaceae ", "Pasteurellaceae ", "Patulibacteraceae ", 
"Paulinellidae ", "Pedinomonadaceae ", "Pelobacteraceae ", 
"Pentatomidae ", "Peptococcaceae ", "Peptostreptococcaceae ", 
"Perkinsidae ", "Phaeosphaeriaceae ", "Phaffomycetaceae ", 
"Phasianidae ", "Phycodnaviridae ", "Phyllobacteriaceae ", 
"Pieridae ", "Pinaceae ", "Pipidae ", "Piscirickettsiaceae ", 
"Planctomycetaceae ", "Planococcaceae ", "Plectosphaerellaceae ", 
"Pleosporaceae ", "Poaceae ", "Polyangiaceae ", "Porphyromonadaceae ", 
"Prevotellaceae ", "Prochlorococcaceae ", "Promicromonosporaceae ", 
"Propionibacteriaceae ", "Psathyrellaceae ", "Pseudoalteromonadaceae ", 
"Pseudomonadaceae ", "Pseudonocardiaceae ", "Psychromonadaceae ", 
"Pteridaceae ", "Pteromalidae ", "Puniceicoccaceae ", "Rhabditidae ", 
"Rhacocarpaceae ", "Rhizobiaceae ", "Rhodobacteraceae ", "Rhodocyclaceae ", 
"Rhodospirillaceae ", "Rhodothermaceae ", "Rickettsiaceae ", 
"Rikenellaceae ", "Rubrobacteraceae ", "Ruminococcaceae ", 
"Rutaceae ", "Saccharomycetaceae ", "Salicaceae ", "Salinisphaeraceae ", 
"Sanguibacteraceae ", "Saprospiraceae ", "Sarcocystidae ", 
"Saturniidae ", "Schizophyllaceae ", "Schizosaccharomycetaceae ", 
"Sclerotiniaceae ", "Segniliparaceae ", "Selaginellaceae ", 
"Shewanellaceae ", "Simaroubaceae ", "Simuliidae ", "Siphoviridae ", 
"Solanaceae ", "Solibacteraceae ", "Sordariaceae ", "Sphaeriidae ", 
"Sphaerobacteraceae ", "Sphingobacteriaceae ", "Sphingomonadaceae ", 
"Spirochaetaceae ", "Spiroplasmataceae ", "Sporolactobacillaceae ", 
"Staphylococcaceae ", "Streptococcaceae ", "Streptomycetaceae ", 
"Streptosporangiaceae ", "Strongylocentrotidae ", "Succinivibrionaceae ", 
"Suidae ", "Sulfolobaceae ", "Sutterellaceae ", "Synergistaceae ", 
"Syntrophaceae ", "Syntrophobacteraceae ", "Syntrophomonadaceae ", 
"Tenebrionidae ", "Tetraodontidae ", "Thalassiosiraceae ", 
"Thermaceae ", "Thermoactinomycetaceae ", "Thermoanaerobacteraceae ", 
"Thermoanaerobacterales Family III. Incertae Sedis ", "Thermoanaerobacterales Family IV. Incertae Sedis ", 
"Thermococcaceae ", "Thermodesulfobacteriaceae ", "Thermodesulfobiaceae ", 
"Thermofilaceae ", "Thermomicrobiaceae ", "Thermomonosporaceae ", 
"Thermoplasmataceae ", "Thermoproteaceae ", "Thermotogaceae ", 
"Thiotrichaceae ", "Tremellaceae ", "Trichocomaceae ", "Tricholomataceae ", 
"Trueperaceae ", "Trypanosomatidae ", "Tsukamurellaceae ", 
"Tuberaceae ", "Ulvaceae ", "unclassified (derived from Acidobacteria) ", 
"unclassified (derived from Actinobacteria (class)) ", "unclassified (derived from Actinomycetales) ", 
"unclassified (derived from Alphaproteobacteria) ", "unclassified (derived from Alteromonadales) ", 
"unclassified (derived from Archaea) ", "unclassified (derived from Bacillales) ", 
"unclassified (derived from Bacteria) ", "unclassified (derived from Bacteroidales) ", 
"unclassified (derived from Bacteroidetes) ", "unclassified (derived from Betaproteobacteria) ", 
"unclassified (derived from Burkholderiales) ", "unclassified (derived from Campylobacterales) ", 
"unclassified (derived from Chlorophyceae) ", "unclassified (derived from Chroococcales) ", 
"unclassified (derived from Clostridiales) ", "unclassified (derived from Cnidaria) ", 
"unclassified (derived from Crenarchaeota) ", "unclassified (derived from Dehalococcoidetes) ", 
"unclassified (derived from Deltaproteobacteria) ", "unclassified (derived from Dictyosteliida) ", 
"unclassified (derived from Epsilonproteobacteria) ", "unclassified (derived from Eukaryota) ", 
"unclassified (derived from Euryarchaeota) ", "unclassified (derived from Flavobacteriales) ", 
"unclassified (derived from Flavobacteriia) ", "unclassified (derived from Gammaproteobacteria) ", 
"unclassified (derived from Gloeobacterales) ", "unclassified (derived from Haemosporida) ", 
"unclassified (derived from Halobacteriales) ", "unclassified (derived from Hypocreales) ", 
"unclassified (derived from Ichthyosporea) ", "unclassified (derived from Mamiellales) ", 
"unclassified (derived from Methanomicrobiales) ", "unclassified (derived from Methylophilales) ", 
"unclassified (derived from Microthamniales) ", "unclassified (derived from Myxococcales) ", 
"unclassified (derived from Oedogoniales) ", "unclassified (derived from Onygenales) ", 
"unclassified (derived from Oscillatoriales) ", "unclassified (derived from other sequences) ", 
"unclassified (derived from Peronosporales) ", "unclassified (derived from Placozoa) ", 
"unclassified (derived from Poribacteria) ", "unclassified (derived from Proteobacteria) ", 
"unclassified (derived from Rhizophydiales) ", "unclassified (derived from Rhodobacterales) ", 
"unclassified (derived from Rickettsiales) ", "unclassified (derived from Saccharomycetales) ", 
"unclassified (derived from Spartobacteria) ", "unclassified (derived from Sphingobacteriales) ", 
"unclassified (derived from Sphingobacteriia) ", "unclassified (derived from Spirochaetales) ", 
"unclassified (derived from Stigonematales) ", "unclassified (derived from Synergistetes) ", 
"unclassified (derived from Thaumarchaeota) ", "unclassified (derived from Thermotogales) ", 
"unclassified (derived from unclassified sequences) ", "unclassified (derived from Verrucomicrobiales) ", 
"unclassified (derived from Vibrionales) ", "unclassified (derived from Viruses) ", 
"Ustilaginaceae ", "Vahlkampfiidae ", "Veillonellaceae ", 
"Verrucomicrobiaceae ", "Verrucomicrobia subdivision 3 ", "Vespertilionidae ", 
"Vibrionaceae ", "Victivallaceae ", "Vitaceae ", "Volvocaceae ", 
"Waddliaceae ", "Woodsiaceae ", "Xanthobacteraceae ", "Xanthomonadaceae ", 
"Zygaenidae ", "Zygophyllaceae "), class = "factor"), V3 = c(0.19, 
0.11, 0.06, 0.06, 0.04)), .Names = c("V1", "V2", "V3"), row.names = c(NA, 
5L), class = "data.frame") 
+0

원형 차트는 이러한 데이터를 표현/시각화하는 끔찍한 방법입니다. 다른 것을 시도해야합니다. 당신은'dotchart()'를보고 싶을지도 모른다. – gung

답변

3

이 시도 :

이 데이터를 가정이 dat data.frame에 있으며 1 열을 내림차순으로 정렬됩니다.

piedat <- rbind(dat[1:25,], 
       as.data.frame(c(sum(dat[26:nrow(dat),1]), 
           "Others", 
           sum(dat[26:nrow(dat),3])))) 
관련 문제