Hadoop mapreduce 사용 다른 길이의 부분 문자열을 얻기 위해 코드를 작성하고 있습니다.예제 문자열 "ZYXCBA"및 길이 3 주어진. 내 코드 길이 3 ("ZYX", "YXC", "XCB", "CBA"), 길이 4 ("ZYXC", "YXCB" , "XCBA") 마지막으로 길이 5 ("ZYXCB", "YXCBA").ClassNotFoundException in Hadoop
키 = 문자열의 길이가 내가
값 = "ZYXCBA"원하는 :지도 단계에서
나는 다음과 같은했다.
그래서 매퍼 출력에서 내가 ("ZYXCBA") 문자열을 줄이고 키 (3) 동일 3. 4,5 발생 길이의 모든 문자열을 얻을 수
3,"ZYXCBA"
4,"ZYXCBA"
5,"ZYXCBA"
입니다. 결과는 ArrayList에 수집됩니다.
나는 다음과 같은 명령을 사용하여 내 코드를 실행하고 있습니다 :
Exception in thread "main" java.lang.ClassNotFoundException: hadoopshingles.Saishingles
at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
at java.lang.ClassLoader.loadClass(ClassLoader.java:425)
at java.lang.ClassLoader.loadClass(ClassLoader.java:358)
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:278)
at org.apache.hadoop.util.RunJar.run(RunJar.java:214)
at org.apache.hadoop.util.RunJar.main(RunJar.java:136)
것은 도와주세요 :
[email protected]:~/Documents$ hadoop jar Saishingles.jar hadoopshingles.Saishingles Behara/Shingles/input Behara/Shingles/output
내 코드는 다음과 ::
package hadoopshingles;
import java.io.IOException;
import java.util.ArrayList;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class Saishingles{
public static class shinglesmapper extends Mapper<Object, Text, IntWritable, Text>{
public void map(Object key, Text value, Context context
) throws IOException, InterruptedException {
String str = new String(value.toString());
String[] list = str.split(" ");
int index = Integer.parseInt(list[0]);
String val = list[1];
int length = val.length();
for(int i = index; i <= length; i++)
{
context.write(new IntWritable(index),new Text(val));
}
}
}
public static class shinglesreducer extends Reducer<IntWritable,Text,IntWritable,ArrayList<String>> {
private ArrayList<String> result = new ArrayList<String>();
public void reduce(IntWritable key, Text value, Context context
) throws IOException, InterruptedException {
String str = new String(value.toString());
int newkey = key.get();
int Tz = str.length() - newkey + 1;
int position = 0;
while (position <= Tz)
{
result.add(str.substring(position,position + newkey -1));
position = position + 1;
}
context.write(new IntWritable(newkey),result);
}
}
public static void main(String[] args) throws Exception {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf, "Saishingles");
job.setJarByClass(hadoopshingles.Saishingles.class);
job.setMapperClass(shinglesmapper.class);
job.setCombinerClass(shinglesreducer.class);
job.setReducerClass(shinglesreducer.class);
job.setMapOutputKeyClass(IntWritable.class);
job.setMapOutputValueClass(Text.class);
job.setOutputKeyClass(IntWritable.class);
job.setOutputValueClass(ArrayList.class);
FileInputFormat.addInputPath(job, new Path(args[0]));
FileOutputFormat.setOutputPath(job, new Path(args[1]));
System.exit(job.waitForCompletion(true) ? 0 : 1);
}
}
는 다음과 같은 오류를주고 그림과 같습니다 나 그리고 미리 감사드립니다 :)
고맙지 만 작동하지 않았습니다. –
여전히 동일한 예외가 발생 했습니까 아니면 다른 예외가 있습니까? 또한 Jar 파일에 적절한 디렉토리 구조가있는 클래스가 포함되어 있는지 확인 했습니까? – Amit
동일한 예외가 발생했습니다 –