1、查找表中多余的重復(fù)記錄,重復(fù)記錄是根據(jù)單個(gè)字段(peopleId)來(lái)判斷。
站在用戶的角度思考問(wèn)題,與客戶深入溝通,找到來(lái)賓網(wǎng)站設(shè)計(jì)與來(lái)賓網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗(yàn),讓設(shè)計(jì)與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個(gè)性化、用戶體驗(yàn)好的作品,建站類型包括:成都網(wǎng)站設(shè)計(jì)、成都網(wǎng)站制作、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、申請(qǐng)域名、虛擬空間、企業(yè)郵箱。業(yè)務(wù)覆蓋來(lái)賓地區(qū)。
2、刪除表中多余的重復(fù)記錄,重復(fù)記錄是根據(jù)單個(gè)字段(peopleId)來(lái)判斷,只留有rowid最小的記錄。
3、查找表中多余的重復(fù)記錄(多個(gè)字段)。
4、刪除表中多余的重復(fù)記錄(多個(gè)字段),只留有rowid最小的記錄。
5、查找表中多余的重復(fù)記錄(多個(gè)字段),不包含rowid最小的記錄。就完成了。
這個(gè)函數(shù)的功能主要是用于去除給定字符串中重復(fù)的字符串.在使用中需要指定字符串的分隔符.示例:
str := RemoveSameStr('zhang,Zhang,bao,Bao,bao,zhang', ',');
輸出: zhang,Zhang,bao,Bao
--SQL
str varchar2(1000);
currentIndex number;
startIndex number;
endIndex number;
type str_type is table of varchar2(30) index by binary_integer;
arr str_type;
Result varchar2(1000);
begin
-- 空字符串
if oldStr is null then
return('');
end if;
--字符串太長(zhǎng)
if length(oldStr) 1000 then
return(oldStr);
end if;
str := oldStr;
currentIndex := 0;
startIndex := 0;
loop
currentIndex := currentIndex + 1;
endIndex := instr(str, sign, 1, currentIndex);
if (endIndex = 0) then
exit;
end if;
arr(currentIndex) := trim(substr(str,
startIndex + 1,
endIndex - startIndex - 1));
startIndex := endIndex;
end loop;
--取最后一個(gè)字符串:
arr(currentIndex) := substr(str, startIndex + 1, length(str));
--去掉重復(fù)出現(xiàn)的字符串:
for i in 1 .. currentIndex - 1 loop
for j in i + 1 .. currentIndex loop
if arr(i) = arr(j) then
arr(j) := '';
end if;
end loop;
end loop;
str := '';
for i in 1 .. currentIndex loop
if arr(i) is not null then
str := str || sign || arr(i);
--數(shù)組置空:
arr(i) := '';
end if;
end loop;
--去掉前面的標(biāo)識(shí)符:
Result := substr(str, 2, length(str));
return(Result);
end RemoveSameStr;
轉(zhuǎn)載,僅供參考。
可按如下方法去除:
如,test表中有如下數(shù)據(jù):
現(xiàn)在要?jiǎng)h除那么重復(fù)的數(shù)據(jù),只保留其中一條,可用如下語(yǔ)句:
delete?from?test?where?rowid?not?in?(select?max(rowid)?from?test?group?by?name);
commit;
執(zhí)行后結(jié)果為:
Oracle數(shù)據(jù)庫(kù)重復(fù)的數(shù)據(jù)一般有兩種去重方法,一、完全重復(fù)數(shù)據(jù)去重;二、部分字段數(shù)據(jù)重復(fù)去重。
一、完全重復(fù)數(shù)據(jù)去重方法
對(duì)于表中完全重復(fù)數(shù)據(jù)去重,可以采用以下SQL語(yǔ)句。
Code
CREATETABLE"#temp"AS (SELECTDISTINCT * FROM 表名);--創(chuàng)建臨時(shí)表,并把DISTINCT 去重后的數(shù)據(jù)插入到臨時(shí)表中
truncateTABLE 表名;--清空原表數(shù)據(jù)
INSERTINTO 表名(SELECT * FROM"#temp");--將臨時(shí)表數(shù)據(jù)插入到原表中
DROPTABLE"#temp";--刪除臨時(shí)表
具體思路是,首先創(chuàng)建一個(gè)臨時(shí)表,然后將DISTINCT之后的表數(shù)據(jù)插入到這個(gè)臨時(shí)表中;然后清空原表數(shù)據(jù);再講臨時(shí)表中的數(shù)據(jù)插入到原表中;最后刪除臨時(shí)表。
二、部分?jǐn)?shù)據(jù)去重方法
首先查找重復(fù)數(shù)據(jù)
select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) 1
將上面的號(hào)改為=號(hào)就可以查詢出沒(méi)有重復(fù)的數(shù)據(jù)了。
想要?jiǎng)h除這些重復(fù)的數(shù)據(jù),可以使用下面語(yǔ)句進(jìn)行刪除:
deletefrom 表名 a where 字段1,字段2 in
(select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) 1)
oracle產(chǎn)品服務(wù)
甲骨文公司產(chǎn)品主要有以下幾類:
甲骨文股份有限公司
1.服務(wù)器及工具
數(shù)據(jù)庫(kù)服務(wù)器:2013年最新版本Oracle 12C。
應(yīng)用服務(wù)器:Oracle Application Server。
開(kāi)發(fā)工具:OracleJDeveloper,Oracle Designer,Oracle Developer,等等。
2.企業(yè)應(yīng)用軟件
企業(yè)資源計(jì)劃(ERP)軟件。已有10年以上的歷史。2005年,并購(gòu)了開(kāi)發(fā)企業(yè)軟件的仁科軟件公司(PeopleSoft)以增強(qiáng)在這方面的競(jìng)爭(zhēng)力。
客戶關(guān)系管理(CRM)軟件。自1998年開(kāi)始研發(fā)這種軟件。2005年,并購(gòu)了開(kāi)發(fā)客戶關(guān)系管理軟件的希柏軟件公司(Siebel)。
3. Oracle職業(yè)發(fā)展力計(jì)劃(Oracle WDP)
Oracle WDP 全稱為Oracle Workforce Development Program,是Oracle (甲骨文)公司專門(mén)面向?qū)W生、個(gè)人、在職人員等群體開(kāi)設(shè)的職業(yè)發(fā)展力課程。Oracle的技術(shù)廣泛應(yīng)用于各行各業(yè),其中電信、電力、金融、政府及大量制造業(yè)都需要Oracle技術(shù)人才,Oracle公司針對(duì)職業(yè)教育市場(chǎng)在全球推廣的項(xiàng)目,其以低廉的成本給這部分人群提供Oracle技術(shù)培訓(xùn),經(jīng)過(guò)系統(tǒng)化的實(shí)訓(xùn),讓這部分人群能夠迅速掌握Oracle最新的核心技術(shù),并能勝任企業(yè)大型數(shù)據(jù)庫(kù)管理、維護(hù)、開(kāi)發(fā)工作。
重復(fù)的數(shù)據(jù)可能有這樣兩種情況,第一種時(shí)表中只有某些字段一樣,第二種是兩行記錄完全一樣。Oracle數(shù)據(jù)庫(kù)重復(fù)數(shù)據(jù)刪除技術(shù)有如下優(yōu)勢(shì):更大的備份容量、數(shù)據(jù)能得到持續(xù)驗(yàn)證、有更高的數(shù)據(jù)恢復(fù)服務(wù)水平、方便實(shí)現(xiàn)備份數(shù)據(jù)的容災(zāi)。
一、刪除部分字段重復(fù)數(shù)據(jù)先來(lái)談?wù)勅绾尾樵冎貜?fù)的數(shù)據(jù)吧。
下面語(yǔ)句可以查詢出那些數(shù)據(jù)是重復(fù)的:
select
字段1,字段2,count(*)
from
表名
group
by
字段1,字段2
having
count(*)
1
將上面的號(hào)改為=號(hào)就可以查詢出沒(méi)有重復(fù)的數(shù)據(jù)了。
想要?jiǎng)h除這些重復(fù)的數(shù)據(jù),可以使用下面語(yǔ)句進(jìn)行刪除
delete
from
表名
a
where
字段1,字段2
in
(select
字段1,字段2,count(*)
from
表名
group
by
字段1,字段2
having
count(*)
1)
上面的語(yǔ)句非常簡(jiǎn)單,就是將查詢到的數(shù)據(jù)刪除掉。不過(guò)這種刪除執(zhí)行的效率非常低,對(duì)于大數(shù)據(jù)量來(lái)說(shuō),可能會(huì)將數(shù)據(jù)庫(kù)吊死。所以我建議先將查詢到的重復(fù)的數(shù)據(jù)插入到一個(gè)臨時(shí)表中,然后對(duì)進(jìn)行刪除,這樣,執(zhí)行刪除的時(shí)候就不用再進(jìn)行一次查詢了。如下:
CREATE
TABLE
臨時(shí)表
AS
(select
字段1,字段2,count(*)
from
表名
group
by
字段1,字段2
having
count(*)
1)
上面這句話就是建立了臨時(shí)表,并將查詢到的數(shù)據(jù)插入其中。
下面就可以進(jìn)行這樣的刪除操作了:
delete
from
表名
a
where
字段1,字段2
in
(select
字段1,字段2
from
臨時(shí)表);
這種先建臨時(shí)表再進(jìn)行刪除的操作要比直接用一條語(yǔ)句進(jìn)行刪除要高效得多。
這個(gè)時(shí)候,大家可能會(huì)跳出來(lái)說(shuō),什么?你叫我
正在看的ORACLE教程是:oracle快速刪除重復(fù)的記錄。做項(xiàng)目的時(shí)候,一位同事導(dǎo)數(shù)據(jù)的時(shí)候,不小心把一個(gè)表中的數(shù)據(jù)全都搞重了,也就是說(shuō),這個(gè)表里所有的記錄都有一條重復(fù)的。這個(gè)表的數(shù)據(jù)是千萬(wàn)級(jí)的,而且是生產(chǎn)系統(tǒng)。也就是說(shuō),不能把所有的記錄都刪除,而且必須快速的把重復(fù)記錄刪掉。
對(duì)此,總結(jié)了一下刪除重復(fù)記錄的方法,以及每種方法的優(yōu)缺點(diǎn)。
為了陳訴方便,假設(shè)表名為T(mén)bl,表中有三列col1,col2,col3,其中col1,col2是主鍵,并且,col1,col2上加了索引。
1、通過(guò)創(chuàng)建臨時(shí)表
可以把數(shù)據(jù)先導(dǎo)入到一個(gè)臨時(shí)表中,然后刪除原表的數(shù)據(jù),再把數(shù)據(jù)導(dǎo)回原表,SQL語(yǔ)句如下:
creat table tbl_tmp (select distinct* from tbl);truncate table tbl;//清空表記錄insert into tbl select * from tbl_tmp;//將臨時(shí)表中的數(shù)據(jù)插回來(lái)。
這種方法可以實(shí)現(xiàn)需求,但是很明顯,對(duì)于一個(gè)千萬(wàn)級(jí)記錄的表,這種方法很慢,在生產(chǎn)系統(tǒng)中,這會(huì)給系統(tǒng)帶來(lái)很大的開(kāi)銷(xiāo),不可行。
2、利用rowid
在oracle中,每一條記錄都有一個(gè)rowid,rowid在整個(gè)數(shù)據(jù)庫(kù)中是唯一的,rowid確定了每條記錄是oracle中的哪一個(gè)數(shù)據(jù)文件、塊、行上。在重復(fù)的記錄中,可能所有列的內(nèi)容都相同,但rowid不會(huì)相同。SQL語(yǔ)句如下:
delete from tbl where rowid in (select a.rowid from tbl a, tbl b where a.rowidb.rowid and a.col1=b.col1 and a.col2 = b.col2)
如果已經(jīng)知道每條記錄只有一條重復(fù)的,這個(gè)sql語(yǔ)句適用。但是如果每條記錄的重復(fù)記錄有N條,這個(gè)N是未知的,就要考慮適用下面這種方法了。
3、利用max或min函數(shù)
這里也要使用rowid,與上面不同的是結(jié)合max或min函數(shù)來(lái)實(shí)現(xiàn)。SQL語(yǔ)句如下
delete from tbl awhere rowid not in (select max(b.rowid) from tbl b where a.col1=b.col1 and a.col2 = b.col2);//這里max使用min也可以
或者用下面的語(yǔ)句
delete from tbl awhere rowid(select max(b.rowid) from tbl b where a.col1=b.col1 and a.col2 = b.col2);//這里如果把max換成min的話,前面的where子句中需要把""改為""
跟上面的方法思路基本是一樣的,不過(guò)使用了group by,減少了顯性的比較條件,提高效率。SQL語(yǔ)句如下:
deletefrom tbl where rowid not in (select max(rowid) from tbl tgroup by t.col1, t.col2);delete from tbl where (col1, col2) in (select col1,col2 from tblgroup bycol1,col2havingcount(*) 1)and rowidnotin(selectnin(rowid)fromtblgroup bycol1,col2havingcount(*) 1)
還有一種方法,對(duì)于表中有重復(fù)記錄的記錄比較少的,并且有索引的情況,比較適用。假定col1,col2上有索引,并且tbl表中有重復(fù)記錄的記錄比較少,SQL語(yǔ)句如下4、利用group by,提高效率
網(wǎng)站欄目:oracle如何去除重復(fù),Oracle 去重復(fù)
文章出自:http://jinyejixie.com/article20/dsdjsjo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供建站公司、關(guān)鍵詞優(yōu)化、虛擬主機(jī)、靜態(tài)網(wǎng)站、網(wǎng)頁(yè)設(shè)計(jì)公司、營(yíng)銷(xiāo)型網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)