Java編程通過(guò)匹配合并數(shù)據(jù)實(shí)例解析(數(shù)據(jù)預(yù)處理)
本文研究的主要是Java編程通過(guò)匹配合并數(shù)據(jù)(數(shù)據(jù)預(yù)處理)的相關(guān)內(nèi)容,具體如下。
數(shù)據(jù)描述
以下程序是對(duì)如下格式的數(shù)據(jù)進(jìn)行合并處理。
這個(gè)表的每一行表示用戶id及用戶的特征。其中,一個(gè)用戶只有一個(gè)特征向量,即第一列不會(huì)重復(fù)。
這張表的第一列,表示用戶的id,第二列表示用戶所看的電影,第三列表示用戶對(duì)電影的打分(1-13分),第四列表示用戶對(duì)電影的打分,但分值范圍是1-5分。
問(wèn)題描述
在做數(shù)據(jù)預(yù)處理時(shí),如何將第二張表添加上用戶特征呢?其實(shí),方法很簡(jiǎn)單,將第二張表的用戶id與第一張表的用戶id進(jìn)行匹配就行。合并結(jié)果如下圖所示。
數(shù)據(jù)處理程序
package deal; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStreamReader; import java.math.BigDecimal; import java.util.ArrayList; import java.util.HashMap; import java.util.List; /* * author:合肥工業(yè)大學(xué) 管院學(xué)院 錢洋 * email:1563178220@qq.com */ public class GetPUser { public static List<String> readDocs(String docsPath,String code) throws IOException{ BufferedReader reader = new BufferedReader( new InputStreamReader( new FileInputStream( new File(docsPath)),code)); String s=null; List<String> userproductscore=new ArrayList<String>(); while ((s=reader.readLine())!=null) { userproductscore.add(s); } reader.close(); return userproductscore; } public static HashMap<String, String> MAPread(String docsPath1,String code1) throws IOException{ BufferedReader reader1 = new BufferedReader( new InputStreamReader( new FileInputStream( new File(docsPath1)),code1)); String s1=null; HashMap<String,String> userfeaturemap=new HashMap<String,String>(); while ((s1=reader1.readLine())!=null) { String arr[]=s1.split("\t"); String feature=""; for (int i = 1; i < arr.length; i++) { BigDecimal db = new BigDecimal(arr[i]); String ii = db.toPlainString(); feature+=ii+" "; } userfeaturemap.put(s1.split("\t")[0], feature); } reader1.close(); return userfeaturemap; } public static List<String> match(List<String> userproductscore,HashMap<String, String> userfeaturemap) throws IOException{ List<String> userscoreandfeature=new ArrayList<>(); for (int i = 0; i < userproductscore.size(); i++) { //獲取用戶id String user_id=userproductscore.get(i).split("\t")[0]; //獲取用戶特征 String userfeature = userfeaturemap.get(user_id); userscoreandfeature.add(userproductscore.get(i)+"\t"+userfeature); System.out.println(userproductscore.get(i)+"\t"+userfeature); } return userscoreandfeature; } public static void main(String[] args) throws IOException { //讀取兩個(gè)文本 List<String> userproductscore=readDocs("data/train/ydata-ymovies-user-movie-ratings-train-v1_0.txt","gbk"); HashMap<String, String> userfeaturemap=MAPread("data/fileofuser/yahoo.txt","utf-8"); //匹配結(jié)果 match(userproductscore,userfeaturemap); } }
總結(jié)
以上就是本文關(guān)于Java編程通過(guò)匹配合并數(shù)據(jù)實(shí)例解析(數(shù)據(jù)預(yù)處理)的全部?jī)?nèi)容,希望對(duì)大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站其他相關(guān)專題,如有不足之處,歡迎留言指出。感謝朋友們對(duì)本站的支持!
上一篇:Java編程swing組件JLabel詳解以及使用示例
欄 目:Java編程
下一篇:Java編程使用UDP建立群聊系統(tǒng)代碼實(shí)例
本文標(biāo)題:Java編程通過(guò)匹配合并數(shù)據(jù)實(shí)例解析(數(shù)據(jù)預(yù)處理)
本文地址:http://mengdiqiu.com.cn/a1/Javabiancheng/8367.html
您可能感興趣的文章
- 01-10Java咖啡館(1)——嘆咖啡
- 01-10Java Socket編程(三) 服務(wù)器Sockets
- 01-10Java進(jìn)階:Struts多模塊的技巧
- 01-10Java Socket編程(一) Socket傳輸模式
- 01-10Java Socket編程(二) Java面向連接的類
- 01-10Java運(yùn)行時(shí)多態(tài)性的實(shí)現(xiàn)
- 01-10Java經(jīng)驗(yàn)點(diǎn)滴:處理沒(méi)有被捕獲的異常
- 01-10Java Socket編程(四) 重復(fù)和并發(fā)服務(wù)器
- 01-10Java中的浮點(diǎn)數(shù)分析
- 01-10面向?qū)ο缶幊?Java中的抽象數(shù)據(jù)類型


閱讀排行
- 1C語(yǔ)言 while語(yǔ)句的用法詳解
- 2java 實(shí)現(xiàn)簡(jiǎn)單圣誕樹(shù)的示例代碼(圣誕
- 3利用C語(yǔ)言實(shí)現(xiàn)“百馬百擔(dān)”問(wèn)題方法
- 4C語(yǔ)言中計(jì)算正弦的相關(guān)函數(shù)總結(jié)
- 5c語(yǔ)言計(jì)算三角形面積代碼
- 6什么是 WSH(腳本宿主)的詳細(xì)解釋
- 7C++ 中隨機(jī)函數(shù)random函數(shù)的使用方法
- 8正則表達(dá)式匹配各種特殊字符
- 9C語(yǔ)言十進(jìn)制轉(zhuǎn)二進(jìn)制代碼實(shí)例
- 10C語(yǔ)言查找數(shù)組里數(shù)字重復(fù)次數(shù)的方法
本欄相關(guān)
- 01-10Java咖啡館(1)——嘆咖啡
- 01-10JVM的垃圾回收機(jī)制詳解和調(diào)優(yōu)
- 01-10Java Socket編程(三) 服務(wù)器Sockets
- 01-10Java進(jìn)階:Struts多模塊的技巧
- 01-10J2SE 1.5版本的新特性一覽
- 01-10Java Socket編程(一) Socket傳輸模式
- 01-10Java運(yùn)行時(shí)多態(tài)性的實(shí)現(xiàn)
- 01-10Java Socket編程(二) Java面向連接的類
- 01-10Java Socket編程(四) 重復(fù)和并發(fā)服務(wù)
- 01-10Java經(jīng)驗(yàn)點(diǎn)滴:處理沒(méi)有被捕獲的異常
隨機(jī)閱讀
- 08-05dedecms(織夢(mèng))副欄目數(shù)量限制代碼修改
- 08-05DEDE織夢(mèng)data目錄下的sessions文件夾有什
- 01-10C#中split用法實(shí)例總結(jié)
- 01-10SublimeText編譯C開(kāi)發(fā)環(huán)境設(shè)置
- 01-11ajax實(shí)現(xiàn)頁(yè)面的局部加載
- 04-02jquery與jsp,用jquery
- 01-11Mac OSX 打開(kāi)原生自帶讀寫(xiě)NTFS功能(圖文
- 01-10使用C語(yǔ)言求解撲克牌的順子及n個(gè)骰子
- 08-05織夢(mèng)dedecms什么時(shí)候用欄目交叉功能?
- 01-10delphi制作wav文件的方法