html拆分单元格多行,拆分一个单元格中多行字符到不同单元格
有如下格式excel數據:
Number? ?? ?? ???ID? ?? ?? ?? ?? ? Assignment
1? ?? ?? ?? ?? ?? ?? ?A? ?? ?? ?? ?? ?? ?? ???AS1
B? ?? ?? ?? ?? ?? ?? ???AS2
C? ?? ?? ?? ?? ?? ?? ???AS3
2? ?? ?? ?? ?? ?? ?? ?A? ?? ?? ?? ?? ?? ?? ???AS5
D? ?? ?? ?? ?? ?? ?? ???AS2
3? ?? ?? ?? ?? ?? ?? ?E? ?? ?? ?? ?? ?? ?? ???AS6
...
以Number為1的這個觀察值來說,ID:A,B,C在同一個excel單元格里的不同行,同理Assigment:AS1,AS2,AS3也在同一個excel單元格里的不同行。
現想用stata將同一個單元格中不同行的string轉入不同觀察值,如下格式所示:
Number? ?? ?? ?ID? ?? ?? ?? ?? ?? ? Assignment
1? ?? ?? ?? ?? ?? ???A? ?? ?? ?? ?? ?? ?? ?? ???AS1
1? ?? ?? ?? ?? ?? ???B? ?? ?? ?? ?? ?? ?? ?? ???AS2
1? ?? ?? ?? ?? ?? ???C? ?? ?? ?? ?? ?? ?? ?? ???AS3
2? ?? ?? ?? ?? ?? ???A? ?? ?? ?? ?? ?? ?? ?? ???AS5
2? ?? ?? ?? ?? ?? ???D? ?? ?? ?? ?? ?? ?? ?? ???AS2
3? ?? ?? ?? ?? ?? ???E? ?? ?? ?? ?? ?? ?? ?? ???AS6
...
哪位高手有什么好的解決方法么?
非常感謝!
2013-6-25 00:51:20 上傳
我已將voodoo提供的方法評為最佳答案,思路清晰,程序簡潔明了。sungmoo提供的方案也很好,但是正如voodoo所說,excel copy+paste到stata產生錯行,用Stata編程解決錯行,并達成最終目的,這恐怕只有像sungmoo一樣具備極高超技能才能解決,一般人不太容易理解。
但是voodoo的方法離完美還差那么一點點,問題就在于第一步excel的預處理,這里還要感謝那么現在的問題就轉換為如何用Stata處理導入excel帶來的換行問題。Dr Nick Cox編寫的charlist(需要ssc install)可以查看variable中包含的ASCII碼,但是很遺憾,經我試驗,這個命令并不顯示“換行”字符。經Statalist上Joseph Coveney的提示,char(10)和 char(13)分別代表line feed和carriage return。于是我用subinstr解決字符替換問題。最后結合voodoo的代碼后,我編寫完整程序如下:
***import data***
clear
import excel "Example.xlsx", sheet("sheet1") firstrow
***replace line feed with "///"***
gen ids=subinstr(ID,char(10),"///",.)
gen assignments=subinstr(Assignment,char(10),"///",.)
***split each ID and Assignment into different observations***
split ids, gen(ID) parse("///")
split assignments, gen(Assignment) parse("///")
drop ID Assignment ids assignments
***reshape to long data***
reshape long ID Assignment, i(Number) j(num)
drop if ID==""&Assignment==""
針對上述程序,sungmoo又提出了讓代碼更簡潔的修改建議
import excel "Example.xls", sh("sheet1") first clear
split ID, p(`=char(10)')
split Assignment, p(`=char(10)')
drop ID Assignment
reshape long ID Assignment, i(Number)
drop if ID==""
最后感謝所有參與這個帖子討論的人,真的獲益良多。
總結
以上是生活随笔為你收集整理的html拆分单元格多行,拆分一个单元格中多行字符到不同单元格的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 诚之和:滴滴禁闭百日司机、用户与暗战
- 下一篇: 牛客网——MySQL数据库练习