2009-05-14 3 views
1

영어로 가장 자주 사용되는 200-1000 개 단어의 파일을 원합니다. 나는 200,000 개의 단어 또는 어쨌든간에 어리석은 목록을 찾을 수 있었지만, 자주 사용되는 단어가 적은 세트는 찾지 못했습니다.프로그램을 테스트하기 위해 .txt 단어 빈도 목록을 찾으십시오.

단어는 한 줄에 하나씩 사용하는 것이 좋지만 그렇지 않은 경우 단어를 형식 지정할 수 있습니다.

고맙습니다!

+5

거대한 목록 중 상위 200-1000 개의 항목 중 가장 자주 찾는 항목을 선택하는 작은 프로그램을 작성하지 않았습니까? –

+0

이것들은 반드시 존재해야합니다 ... 그런 작업을하기 전에 계속 살펴볼 것입니다. – cksubs

+1

@cksubs, 열심히해서는 안됩니다, 내 대답은 (!) 작업 솔루션이어야합니다 보여줍니다. – UnkwnTech

답변

0

여기에 최고 250 McWafflestix의 링크, 똑바로, 아니 외부 공간 등으로부터 감사 죽일 - 사각형을하는 이맥스에서 (적은 더는 강조)입니다. 나는 이것이 꽤 사소하고 프로그래밍과 관련이 없다고 말해야 만한다.

the 
of 
to 
and 
a 
in 
is 
it 
you 
that 
he 
was 
for 
on 
are 
with 
as 
I 
his 
they 
be 
at 
one 
have 
this 
from 
or 
had 
by 
hot 
but 
some 
what 
there 
we 
can 
out 
other 
were 
all 
your 
when 
up 
use 
word 
how 
said 
an 
each 
she 
which 
do 
their 
time 
if 
will 
way 
about 
many 
then 
them 
would 
write 
like 
so 
these 
her 
long 
make 
thing 
see 
him 
two 
has 
look 
more 
day 
could 
go 
come 
did 
my 
sound 
no 
most 
number 
who 
over 
know 
water 
than 
call 
first 
people 
may 
down 
side 
been 
now 
find 
any 
new 
work 
part 
take 
get 
place 
made 
live 
where 
after 
back 
little 
only 
round 
man 
year 
came 
show 
every 
good 
me 
give 
our 
under 
name 
very 
through 
just 
form 
much 
great 
think 
say 
help 
low 
line 
before 
turn 
cause 
same 
mean 
differ 
move 
right 
boy 
old 
too 
does 
tell 
sentence 
set 
three 
want 
air 
well 
also 
play 
small 
end 
put 
home 
read 
hand 
port 
large 
spell 
add 
even 
land 
here 
must 
big 
high 
such 
follow 
act 
why 
ask 
men 
change 
went 
light 
kind 
off 
need 
house 
picture 
try 
us 
again 
animal 
point 
mother 
world 
near 
build 
self 
earth 
father 
head 
stand 
own 
page 
should 
country 
found 
answer 
school 
grow 
study 
still 
learn 
plant 
cover 
food 
sun 
four 
thought 
let 
keep 
eye 
never 
last 
door 
between 
city 
tree 
cross 
since 
hard 
start 
might 
story 
saw 
far 
sea 
draw 
left 
late 
run 
don't 
while 
press 
close 
night 
real 
life 
few 
stop 
1

나는 "주파수 별 영어 단어"를 검색하여 여러 가지 유용한 정보를 발견했다. 여기에 on wiktionary.org이 있습니다.

1

Here이 상위 500 개입니다. HTML에서 목록을 긁어 낼 수 있습니다.

0

간단한 해결책이 테스트되지 않았지만 99 % 양호해야합니다.

<?php 
$fh = fopen('http://domain.tld/path/tofile.txt', 'r'); 
$wordList = array(); 
for($i=0;$i<100;$i++) 
    $wordList[] = fread($fh, 1024); 
print_r($wordList); 
?> 
관련 문제