2023-07-04 18:29:20來源:今日頭條
如果沒有適當(dāng)?shù)臄?shù)據(jù)測試,生產(chǎn)中的數(shù)據(jù)質(zhì)量就是不完整的。在本文中,您將學(xué)習(xí)數(shù)據(jù)測試的基礎(chǔ)知識以及如何開始。
數(shù)據(jù)質(zhì)量對于數(shù)據(jù)倉庫、主數(shù)據(jù)管理(MDM)、客戶關(guān)系管理(CRM)和其他以數(shù)據(jù)為中心的項目至關(guān)重要。然而,在開發(fā)過程中,往往忽視了數(shù)據(jù)質(zhì)量,直到系統(tǒng)完全在生產(chǎn)環(huán)境中運(yùn)行才開始重視。這導(dǎo)致了數(shù)據(jù)質(zhì)量方面的巨大差距,因為在項目的開發(fā)階段幾乎沒有或沒有進(jìn)行測試。
【資料圖】
數(shù)據(jù)就像是一個產(chǎn)品,而數(shù)據(jù)系統(tǒng)就像是生產(chǎn)這個產(chǎn)品的工廠。在工廠中,質(zhì)量分為兩個組成部分:質(zhì)量保證和質(zhì)量控制。讓我們深入了解這些概念以及它們?nèi)绾螒?yīng)用于數(shù)據(jù)質(zhì)量。
質(zhì)量保證(QA)與質(zhì)量控制(QC)質(zhì)量保證:通過質(zhì)量保證過程驗證原材料和加工方法的質(zhì)量,以確保最終產(chǎn)品的缺陷最小化。
在數(shù)據(jù)領(lǐng)域,質(zhì)量保證(QA)和質(zhì)量控制(QC)的概念可以應(yīng)用于數(shù)據(jù)質(zhì)量的管理。傳統(tǒng)的數(shù)據(jù)質(zhì)量方法存在一些缺點(diǎn),其中數(shù)據(jù)測試經(jīng)常被忽視。
傳統(tǒng)數(shù)據(jù)質(zhì)量方法的局限性包括:
ETL測試:數(shù)據(jù)質(zhì)量工具設(shè)計用于測試數(shù)據(jù),而不是進(jìn)行ETL測試。太少、太遲:數(shù)據(jù)質(zhì)量流程僅在最終數(shù)據(jù)交付生產(chǎn)環(huán)境時應(yīng)用。到那時,有缺陷的數(shù)據(jù)系統(tǒng)已經(jīng)投入使用。垃圾輸入,垃圾輸出:開發(fā)過程中使用的原始數(shù)據(jù)從未經(jīng)過測試。因此,開發(fā)人員對數(shù)據(jù)的各種排列組合可能性并不清楚。錯誤的數(shù)據(jù)處理導(dǎo)致糟糕的數(shù)據(jù)質(zhì)量:數(shù)據(jù)處理過程本身可能是錯誤的,從而導(dǎo)致低質(zhì)量的數(shù)據(jù)。數(shù)據(jù)處理的錯誤編排:通常,數(shù)據(jù)處理是按特定順序和時間執(zhí)行各種數(shù)據(jù)處理過程,以將來自多個源的數(shù)據(jù)集成為一個統(tǒng)一的視圖。錯誤的數(shù)據(jù)模式:如果數(shù)據(jù)模型存在問題,如錯誤的數(shù)據(jù)類型、錯誤的數(shù)據(jù)類型長度、精度或缺少約束,則生產(chǎn)數(shù)據(jù)中可能會出現(xiàn)許多數(shù)據(jù)問題。這些問題只能在項目的開發(fā)階段通過實(shí)施適當(dāng)?shù)腝A或數(shù)據(jù)測試來解決。
數(shù)據(jù)測試是在將代碼部署到生產(chǎn)環(huán)境之前測試和確認(rèn)數(shù)據(jù)及其處理過程的方法。它包括原始數(shù)據(jù)測試、ETL測試和流程編排的測試。
數(shù)據(jù)測試包括以下活動:
測試原始數(shù)據(jù),確保數(shù)據(jù)符合預(yù)期。測試ETL過程,確保按照要求正確編碼和轉(zhuǎn)換數(shù)據(jù)。對ETL過程生成的數(shù)據(jù)輸出進(jìn)行業(yè)務(wù)驗證。開始進(jìn)行數(shù)據(jù)測試的主要步驟包括:
確定需要進(jìn)行測試的過程。查找數(shù)據(jù)過程使用的源表和目標(biāo)表。連接數(shù)據(jù)庫,包括源數(shù)據(jù)庫和目標(biāo)數(shù)據(jù)庫。創(chuàng)建和執(zhí)行數(shù)據(jù)測試規(guī)則,通過檢查數(shù)據(jù)轉(zhuǎn)換過程中的問題來驗證數(shù)據(jù)質(zhì)量。審查數(shù)據(jù)測試的輸出,檢查數(shù)據(jù)轉(zhuǎn)換過程中的缺陷。綜上所述,數(shù)據(jù)質(zhì)量管理不僅僅是一個生產(chǎn)環(huán)境中的概念,同樣重要的是在開發(fā)階段進(jìn)行數(shù)據(jù)測試。
開發(fā)階段的數(shù)據(jù)測試和生產(chǎn)環(huán)境中的數(shù)據(jù)監(jiān)控相結(jié)合,可以在數(shù)據(jù)質(zhì)量方面提供最佳效果,并且非常有效。
關(guān)鍵詞:
如果沒有適當(dāng)?shù)臄?shù)據(jù)測試,生產(chǎn)中的數(shù)據(jù)質(zhì)量就是不完整的。在本文中,您
在編寫測試時,這些指導(dǎo)方針將作為要遵循的最佳實(shí)踐,這可以導(dǎo)致更高質(zhì)
在日益數(shù)字化的世界中,城市和市政當(dāng)局必須利用技術(shù)和數(shù)據(jù)來提高效率并
日前,“答卷”——長沙師范學(xué)院音樂舞蹈學(xué)院2019級舞蹈學(xué)專業(yè)學(xué)生畢業(yè)
而狼隊第2輪首戰(zhàn)就是北京WB,相當(dāng)于是春季賽決賽重演,一上來強(qiáng)度就直
1、寵妻至上寵你一輩子幸福豬小妹娃娃王妃陪你去隱居腹黑是怎樣煉成的
1、展開3全部申請AppleID時頁面中顯示的需要填寫的電子郵件地址,如下
日前,中建五局長沙機(jī)場改擴(kuò)建項目開展了主題黨日活動,組織項目全體員
直播吧7月4日訊在今天的NBA夏季聯(lián)賽加州經(jīng)典賽中,國王100-94戰(zhàn)勝勇士
原文作者:FernandoDoglio原文地址:https: itnext io the-3-best-monorepo-tools-for-2023-29
腦科學(xué)研究又進(jìn)一大步!來自普林斯頓的科學(xué)家最新宣布,他們已經(jīng)成功創(chuàng)
企業(yè)將業(yè)務(wù)從內(nèi)部部署設(shè)施遷移到云平臺需要大量時間、艱苦的工作和精心
近幾年,圖像生成領(lǐng)域取得了巨大的進(jìn)步,尤其是文本到圖像生成方面取得
我們都知道,大模型具有自省能力,可以對寫出的代碼進(jìn)行自我糾錯。這種
據(jù)韓國媒體“news1”報道,原本計劃9月份在英國與墨西哥隊進(jìn)行的熱身賽