wordcount.java_mapreduce中wordcount的java实现
用java模擬詞頻統(tǒng)計(jì)。
有3個(gè)文件:text1: hello world
text2:hello hadoop
text3:hello mapreduce
對(duì)上面的文件進(jìn)行詞頻統(tǒng)計(jì):結(jié)果應(yīng)該是:hello:3;????hadoop:1;????world:1;????mapreduce:1
代碼實(shí)現(xiàn)如下:
package?count;
import?java.util.Hashtable;
import?java.util.Iterator;
import?java.util.StringTokenizer;
public?class?Count?{
public?static?void?main(String[]?args)?{
String?[]?text?=?new?String[]{"hello?world",?"hello?hadoop",?"hello?mapreduce"};
Hashtable?ht?=?new?Hashtable();
for(int?i=0;?i<3;?i++){
StringTokenizer?st?=?new?StringTokenizer(text[i]);
while(st.hasMoreTokens()){
String?word?=?st.nextToken();
if(!ht.containsKey(word))
ht.put(word,?new?Integer(1));
else{
int?wc?=?((Integer)ht.get(word)).intValue()?+?1;
ht.put(word,?new?Integer(wc));
}
}
}
for(Iterator?itr?=?ht.keySet().iterator();?itr.hasNext();){
String?word?=?(String)itr.next();
System.out.print(word?+?":"?+?(Integer)ht.get(word)+";?");
}
}
}
總結(jié)
以上是生活随笔為你收集整理的wordcount.java_mapreduce中wordcount的java实现的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mysql数据库优化语句_mysql数据
- 下一篇: 华硕服务器主板型号命名规则,常见主板命名