SQL中的重复记录操作
生活随笔
收集整理的這篇文章主要介紹了
SQL中的重复记录操作
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
1、查找表中多余的重復(fù)記錄,重復(fù)記錄是根據(jù)單個字段(peopleId)來判斷
select*from people
where peopleId in (select peopleId from people groupby peopleId havingcount(peopleId) >1) 例二: select * from testtable where numeber in (select number from people group by number having count(number) > 1 ) 可以查出testtable表中number相同的記錄
2、刪除表中多余的重復(fù)記錄,重復(fù)記錄是根據(jù)單個字段(peopleId)來判斷,只留有rowid最小的記錄
deletefrom people
where peopleId in (select peopleId from people groupby peopleId havingcount(peopleId) >1)
and rowid notin (selectmin(rowid) from people groupby peopleId havingcount(peopleId )>1)
3、查找表中多余的重復(fù)記錄(多個字段)
select*from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae groupby peopleId,seq havingcount(*) >1)
4、刪除表中多余的重復(fù)記錄(多個字段),只留有rowid最小的記錄
deletefrom vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae groupby peopleId,seq havingcount(*) >1)
and rowid notin (selectmin(rowid) from vitae groupby peopleId,seq havingcount(*)>1)
5、查找表中多余的重復(fù)記錄(多個字段),不包含rowid最小的記錄
select*from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae groupby peopleId,seq havingcount(*) >1)
and rowid notin (selectmin(rowid) from vitae groupby peopleId,seq havingcount(*)>1)
(二)
比方說
在A表中存在一個字段“name”,
而且不同記錄之間的“name”值有可能會相同,
現(xiàn)在就是需要查詢出在該表中的各記錄之間,“name”值存在重復(fù)的項;
Select Name,Count(*) From A GroupBy Name HavingCount(*) >1
如果還查性別也相同大則如下:
Select Name,sex,Count(*) From A GroupBy Name,sex HavingCount(*) >1
(三)
方法一
declare@maxinteger,@idinteger
declare cur_rows cursor local forselect 主字段,count(*) from 表名 groupby 主字段 havingcount(*) >; 1
open cur_rows
fetch cur_rows into@id,@max
while@@fetch_status=0
begin
select@max=@max-1
setrowcount@max
deletefrom 表名 where 主字段 =@id
fetch cur_rows into@id,@max
end
close cur_rows
setrowcount0
方法二
有兩個意義上的重復(fù)記錄,一是完全重復(fù)的記錄,也即所有字段均重復(fù)的記錄,二是部分關(guān)鍵字段重復(fù)的記錄,比如Name字段重復(fù),而其他字段不一定重復(fù)或都重復(fù)可以忽略。
1、對于第一種重復(fù),比較容易解決,使用
selectdistinct*from tableName
就可以得到無重復(fù)記錄的結(jié)果集。
如果該表需要刪除重復(fù)的記錄(重復(fù)記錄保留1條),可以按以下方法刪除
selectdistinct*into #Tmp from tableName
droptable tableName
select*into tableName from #Tmp
droptable #Tmp
發(fā)生這種重復(fù)的原因是表設(shè)計不周產(chǎn)生的,增加唯一索引列即可解決。
2、這類重復(fù)問題通常要求保留重復(fù)記錄中的第一條記錄,操作方法如下
假設(shè)有重復(fù)的字段為Name,Address,要求得到這兩個字段唯一的結(jié)果集
selectidentity(int,1,1) as autoID, *into #Tmp from tableName
selectmin(autoID) as autoID into #Tmp2 from #Tmp groupby Name,autoID
select*from #Tmp where autoID in(select autoID from #tmp2)
最后一個select即得到了Name,Address不重復(fù)的結(jié)果集(但多了一個autoID字段,實際寫時可以寫在select子句中省去此列)
(四)
查詢重復(fù)
select*from tablename where id in (
select id from tablename
groupby id
havingcount(id) >1
)
select*from people
where peopleId in (select peopleId from people groupby peopleId havingcount(peopleId) >1) 例二: select * from testtable where numeber in (select number from people group by number having count(number) > 1 ) 可以查出testtable表中number相同的記錄
2、刪除表中多余的重復(fù)記錄,重復(fù)記錄是根據(jù)單個字段(peopleId)來判斷,只留有rowid最小的記錄
deletefrom people
where peopleId in (select peopleId from people groupby peopleId havingcount(peopleId) >1)
and rowid notin (selectmin(rowid) from people groupby peopleId havingcount(peopleId )>1)
3、查找表中多余的重復(fù)記錄(多個字段)
select*from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae groupby peopleId,seq havingcount(*) >1)
4、刪除表中多余的重復(fù)記錄(多個字段),只留有rowid最小的記錄
deletefrom vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae groupby peopleId,seq havingcount(*) >1)
and rowid notin (selectmin(rowid) from vitae groupby peopleId,seq havingcount(*)>1)
5、查找表中多余的重復(fù)記錄(多個字段),不包含rowid最小的記錄
select*from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae groupby peopleId,seq havingcount(*) >1)
and rowid notin (selectmin(rowid) from vitae groupby peopleId,seq havingcount(*)>1)
(二)
比方說
在A表中存在一個字段“name”,
而且不同記錄之間的“name”值有可能會相同,
現(xiàn)在就是需要查詢出在該表中的各記錄之間,“name”值存在重復(fù)的項;
Select Name,Count(*) From A GroupBy Name HavingCount(*) >1
如果還查性別也相同大則如下:
Select Name,sex,Count(*) From A GroupBy Name,sex HavingCount(*) >1
(三)
方法一
declare@maxinteger,@idinteger
declare cur_rows cursor local forselect 主字段,count(*) from 表名 groupby 主字段 havingcount(*) >; 1
open cur_rows
fetch cur_rows into@id,@max
while@@fetch_status=0
begin
select@max=@max-1
setrowcount@max
deletefrom 表名 where 主字段 =@id
fetch cur_rows into@id,@max
end
close cur_rows
setrowcount0
方法二
有兩個意義上的重復(fù)記錄,一是完全重復(fù)的記錄,也即所有字段均重復(fù)的記錄,二是部分關(guān)鍵字段重復(fù)的記錄,比如Name字段重復(fù),而其他字段不一定重復(fù)或都重復(fù)可以忽略。
1、對于第一種重復(fù),比較容易解決,使用
selectdistinct*from tableName
就可以得到無重復(fù)記錄的結(jié)果集。
如果該表需要刪除重復(fù)的記錄(重復(fù)記錄保留1條),可以按以下方法刪除
selectdistinct*into #Tmp from tableName
droptable tableName
select*into tableName from #Tmp
droptable #Tmp
發(fā)生這種重復(fù)的原因是表設(shè)計不周產(chǎn)生的,增加唯一索引列即可解決。
2、這類重復(fù)問題通常要求保留重復(fù)記錄中的第一條記錄,操作方法如下
假設(shè)有重復(fù)的字段為Name,Address,要求得到這兩個字段唯一的結(jié)果集
selectidentity(int,1,1) as autoID, *into #Tmp from tableName
selectmin(autoID) as autoID into #Tmp2 from #Tmp groupby Name,autoID
select*from #Tmp where autoID in(select autoID from #tmp2)
最后一個select即得到了Name,Address不重復(fù)的結(jié)果集(但多了一個autoID字段,實際寫時可以寫在select子句中省去此列)
(四)
查詢重復(fù)
select*from tablename where id in (
select id from tablename
groupby id
havingcount(id) >1
)
轉(zhuǎn)載于:https://www.cnblogs.com/xiexingen/archive/2012/11/05/2755863.html
總結(jié)
以上是生活随笔為你收集整理的SQL中的重复记录操作的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 无图形界面下控制台操作Virtualbo
- 下一篇: 燃烧青春和诗意的IT人生