首页 设计制作以网际网路架构为基础的健保资料仓储系统-以医

设计制作以网际网路架构为基础的健保资料仓储系统-以医

举报
开通vip

设计制作以网际网路架构为基础的健保资料仓储系统-以医設計製作以網際網路架構為基礎的健保資料倉儲系統-以醫療費用分析為例DesignandImplementationofAWeb-BaseDataWarehousingSystemforHealthInsurance-AnExampleonAnalysisofMedicalExpenses研究生:朱自強(ChuTzu-Chiang)指導教授:劉德明(LiouDer-Ming)國立陽明大學公共衛生研究所碩士論文NationalYang-MingUniversityInstituteofPublicHealthMaster...

设计制作以网际网路架构为基础的健保资料仓储系统-以医
設計製作以網際網路架構為基礎的健保資料倉儲系統-以醫療費用分析為例DesignandImplementationofAWeb-BaseDataWarehousingSystemforHealthInsurance-AnExampleonAnalysisofMedicalExpenses研究生:朱自強(ChuTzu-Chiang)指導教授:劉德明(LiouDer-Ming)國立陽明大學公共衛生研究所碩士論文NationalYang-MingUniversityInstituteofPublicHealthMasterThesis中華民國八十九年七月July,2000誌謝陳之藩先生所說:「得之於人者太多,出之於己者太少。」我想正是我此刻的心情。我是一個幸運兒,別的不說就這兩年幫助我,讓我完成論文的”貴人”就必須把口水說乾。當然第一個必須提到的就是我的指導老師劉老師,從完全不知道資訊的我進來,他可是超級有耐心,開明的做法讓學生自己去尋找自信。特別是在學生找不到路時老師的目光總是在學生前面引領者我。謝謝郭旭崧老師、王大為老師對學生的教誨;郭老師的智慧,言論的犀利,立論觀點對學生而言就像一本百科全書一樣。王老師對研究的誠實更讓學生在他面前不敢浮華,對我而言他的身教與學識的指導就讓學生一輩子受用。吳肖琪老師是個隨和但嚴謹的老師,從他身上就可感受到生命的熱情,因為老師已經樂在其中,這就是學問精進的來源。劉建財老師雖然只有短短不到兩小時的見面時間,但其學者的風範就讓學生景仰不已,感謝劉老師不吝指教在知識經驗上的傳授。謝謝杜屏瑩學長言行與學問的指導,每個人做事都有目標,對我而言學長求學做人的風範,就是我模擬的對象。感謝啟明、素敏、淑怡學長姊在我最需要的時候自動而樂意的提攜學弟。遠鍇、成娟、淑珍、妙鈴、百婉、貝盈的打氣加油從不間斷,對我而言相當的重要。謝謝健保局的孫浩淳先生,衛生署楊明隆先生經驗上的傳授,讓我少走很多冤枉路。謝謝馬偕醫院的湯進聖先生,每每有問題時真是我電話的救火員,在繁複的資料整理上提供了最珍貴的意見。謝謝思訊科技的連冠毅總經理、謝松樺先生的大力幫忙,你們真是沒話說的好朋友、好夥伴。也謝謝國衛院能提供資料助我完成此論文。資通中心的福隆、麗娟、貴淵、小媚、美玲、健雄、中泰、秀方、薏玲等,這段日子的包容與協助,特別是福隆熱情大聲的嗓門,不知指導我有多少回;從一年級就跟我一起奮鬥的瑞卿,趕去新竹上課的日子彷彿就在昨天;衍文、勝雄學長幸虧你們的關心與幫忙;美連、松明更是幫我負擔了太多的責任,感覺你們就好像跟我一起成長;也謝謝在口試幫忙的芳聆、姿佐,讓我在事後論文的檢討省了不少力氣。要感謝的人實在太多了,實在沒法一一道來,只希望我能記得你們幫我的心,繼續的把路走下去。這一年來父親肩膀開刀,手已不能舉,又發生皮膚癌,家裡正需要人手的時候,父母親卻鼓勵我,要我完成學業,甚至要求我出國深造。家裡的重擔完全由母親一肩挑起。父母的健康,是子女的幸福,這時我深深體會到這句話。因為父母是子女最重要的後盾,沒有父親母親的支持,沒有我的成長。獻給最愛我的父母朱自強僅誌民國八十九年八月於陽明大學資通中心摘要本文摘要全民健保自民國八十四年開辦以來至今已有五年,被保險人對象涵蓋全國民眾,因而產生全體國人珍貴的醫療資料。這些醫療資料對醫院的經營管理者、從事醫療工作人員、公共衛生界的研究人員、健保本身以及其他保險研究人員都顯得相當有價值。中央健康保險局應學界之請託,在保障民眾隱私以及資料安全的前提下,特委託國家衛生研究院以全民健保的資料為基礎,建立一個以學術研究為目的之資訊資料庫,提供給學術單位及非營利機構之學者專家進行醫藥衛生相關研究。鑒於目前健保資料倉儲都僅止於資料的提供,非資訊的產出,而健保資料量大且分析的門檻高,也形成了研究的障礙。故利用國衛院提供之八十六年學術研究健保資料正式版,模擬國衛院健保資料庫,運用資料倉儲的技術,重新設計適合一個線上分析系統的資料倉儲(資料超市-以醫療費用分析為例),並實作應用於網際網路上。期望縮短學者運用健保資料的時間,與降低使用者的門檻。本研究中,使用Kimball,Reeves,Ross,andThornthwaite(1998)提出的『企業維度生命週期』 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 論(BusinessDimensionalLifecycle;BDL),作為本主題專案的建置架構。將原健保資料重新轉換集結至新設計以回答詢問為機制的資料庫。設計網路三層式架構及引入線上分析系統的設計工具,直接讓使用者利用網際網路瀏覽器作線上分析結果重新設計以醫療費用分析為主題導向的資料超市,分為住院費用分析,及門診費用分析兩子系統。使用者能以直覺式的選取拖拉方式選擇所要分析的項目,並可同時配合適當的下探維度階層(drilldown),多維度轉換分析(SliceandDice)提高使用者的彈性與時效。查詢產出的多維度報 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf (CrossTable)可輕易轉換成其他適當圖形,或者更進一步形成文字檔傳回使用者的電腦做更進一步的分析。關鍵字線上交易系統(OLTP),資料倉儲(DataWarehouse),資料超市(DataMart),線上分析系統(OLAP),關鍵效能指標(KeyPerformanceIndicator)。iAbstractIthasbeenatleastfiveyearssinceNationalHeathInsuranceestablishedin1995.Theobjectoftheinsuredcontainsnational-widepeople;therefore,itbringspreciousmedicaltreatmentdatatotheentirecountrymen.Thesemedicaltreatmentdataappeartobeconsiderablyvaluableforthemanagerofthehospital,thestaffsengagedinthemedicaltreatmentwork,theresearchersinpublichealtharea,theNationalHealthInsuranceitself,andotherstaffsofInsuranceresearch.ConsideringthepresentHealthInsurancedatawarehousearealllimitedtothesupplyofdata,nottheproductionofinformation,andthestorageofHealthInsurancedataislargeandnoteasilytobeanalyzed.Theybecomethehindranceofresearch,sobyutilizingthe1997academicresearchHealthInsurancedataformalversionprovidedbyNationalHealthResearchInstitute,weimitatethedatabaseofNationalHealthResearchInstituteandapplythedatawarehousetechniquetoredesignadatawarehousesuitableforaon-lineanalyzesystemandpracticallyapplyittotheInternet.WehopeitcanhelpshortenthehoursofscholarmakinguseoftheHealthInsurancedataandlowerthedifficultyoftheusersusingthissystem.Inthisresearch,theBusinessDimensionalLifecyclemethodologybroughtupbyKimball,Reeves,Ross,andThornthwaite(1998)istheframeworkofthisproject.WeretransformtheoriginalHealthInsurancedataandconcentrateittothenewdatabasedesignedforthefunctionofanswerandquery,designthree-tierarchitecturenetwork,andinjectintothedesigntoolsofon-lineanalyzesystem.ItcanhelptheusersdirectlyutilizetheInternetbrowsertodoon-lineanalyze.KeywordsOnLineTransactionProcessing(OLTP),DataWarehouse,DataMart,OnLineAnalyticalProcessing(OLAP),KeyPerformanceIndicator(KPI)ii目錄中文摘要……………………………………………………………………….i英文摘要……………………………………………………………………….ii目錄…………………………………………………………………………….iii圖目錄………………………………………………………………………….v表目錄………………………………………………………………………….vii第一章緒論………………………………………………………………….1第一節背景與動機…………………………………………………….1第二節研究目的……………………………………………………….3第三節研究限制……………………………………………………….3第四節研究流程……………………………………………………….5第五節論文架構……………………………………………………….6第二章文獻探討…………………………………………………………….7第一節資料倉儲概論………………………………………………….8第二節健保資料倉儲現況分析……………………………………….14第三節健保資料潛在的分析價值…………………………………….21第三章系統架構設計與實作……………………………………………….22第一節專案規劃……………………………………………………….23第二節企業需求規劃………………………………………………….24第三節技術架構設計………………………………………………….25第四節資料領域……………………………………………………….28第五節應用領域……………………………………………………….37第四章成果展示…………………………………………………………….40第一節住院和門診費用分析………………………………………….42第二節健保資料倉儲(原始資料)子系統…………………….……….50第五章討論………………………………………………………………….51第一節資料查核……………………………………………………….51第二節系統設計……………………………………………………….51第三節資料安全……………………………………………………….54第四節資料本身的限制……………………………………………….54第五節系統的使用者………………………………………………….55iii第六章結論與建議………………………………………………………….56第一節結論…………………………………………………………….56第二節後續研究建議………………………………………………….57參考文獻……………………………………………………………………….59附錄(一)………………………………………………………………………..62附錄(二)………………………………………………………………………..63附錄(三)……………………………………………………………….……….69附錄(四)……………………………………………………………….……….70附錄(五)………………………………………………………………………..72附錄(六)………………………………………………………………………..73附錄(七)………………………………………………………………………..129iv圖目錄圖1-1健保資料流程………………………………………………………..1圖1-2研究流程……………………………………………………………..5圖2-1資料倉儲與線上交易系統對系統資源使用情形差異……………..13圖2-2傳統健保資料提供方式……………………………………………..14圖2-3健保局資料倉儲作業流程…………………………………………..15圖2-4中央健保局資料倉儲系統主架構…………………………………..16圖2-5利用「全民健康保險學術研究資料庫」進行醫藥衛生相關研究主題分佈……………………….………….20圖3-1BDL資料倉儲開發方法論………………………………………….22圖3-2三層式架構圖………………………………………………………..26圖3-3原始資料倉儲分類…………………………………………………..28圖3-4模式維度設計………………………………………………………..30圖3-5醫事機構維度設計…………………………………………………..30圖3-6住院之資料超市關聯圖……………………………………………..31圖3-7資料庫實作過程示意圖………….………………………………….33圖3-8設計資料轉換程式畫面……………………………………………..33圖3-9資料集結關聯圖……………………………………………………..34圖3-10DTS程式執行監控畫面……………………………………………..35圖3-11定義中介資料………………………………………………………..37圖3-12階層資料定義………………………………………………………..38圖3-13使用者介面…………………………………………………………..38圖3-14本研究之健保資料倉儲基本架構示意圖…………………………..39圖4-1系統首頁……………………………………………………………..40圖4-2歡迎光臨……………………………………………………………..40圖4-3新增文件……………………………………………………………..41圖4-4住院費用分析………………………………………………………..42圖4-5選取報 表格 关于规范使用各类表格的通知入职表格免费下载关于主播时间做一个表格详细英语字母大小写表格下载简历表格模板下载 式………………………………………………………..44圖4-6選取分析變項………………………………………………………..45圖4-7選擇資料限制型態…………………………………………………..45圖4-8選擇限制條件………………………………………………………..46圖4-9多維度轉換分析條件………………………………………………..46圖4-10查詢的結果(一)………………………………………………………47圖4-11查詢的結果(二)………………………………………………………47圖4-12傳回的檔案…………………………………………………………..48圖4-13詢問並下載原始健保資料…………………………………………..50v圖5-1共用部分維度表格的雙星狀模式…………………………………..52圖5-2錯誤的詢問方式……………………………………………………..53圖5-3系統所產生的SQL語言………………………….…………………53vi表目錄表2-1資料倉儲成長史……………………………………………………..9表3-1全民健保學術研究資料庫86年正式版資料清單(部分)…………..25表3-2使用欄位說明表……………………………………………………..29表3-3所轉入模擬之健保資料倉儲清單…………………………………..32表3-4DTS執行詳細資料…………………….…………………………….36表4-1住院分析維度變項說明……………………………………………..43表4-2門診分析維度變項說明……………………………………………..49表6-1醫院管理導向的指標………………………………………………..57vii第一章緒論第一章緒論第一節背景與動機我國自民國八十四年三月正式開辦全民健康保險,至今也有五年了,被保險人對象涵蓋全國民眾,因而產生全體國人珍貴的醫療資料。這些醫療資料對醫院的經營管理者、從事醫療工作人員、公共衛生界的研究人員、健保本身以及其他保險研究人員都相當有價值。因此中央健康保險局應學界之請託,在保障民眾隱私以及資料安全的前提下,特委託國家衛生研究院以全民健保的資料為基礎,建立一個以學術研究為目的之資訊資料庫,提供給學術單位及非營利機構之學者專家進行醫藥衛生相關研究[國衛院00/5](圖1-1)。一般而言,研究人員可由三個管道來取得健保資料:1.行政院衛生署;2.中央健康保險局;3.國家衛生研究院。衛生署的健保資料倉儲(datawarehouse)因為還在建置當中,且使用的對象為衛生署本身為建立衛生政策之用,並不會對外開放,所以除非是衛生署的指定人員或者署所委託的研究計劃,否則也無從接觸。而中央健康保險局雖然資料倉儲已有相當的規模,但使用者與衛生署類似,除非是由健保局委託研究計劃,否則也難以得其資料。其餘的,就是向國衛院申請得資料。申請資格與過程,非本論文重點,請自行參閱國衛院網頁(http://www.nhri.org.tw/nhird/)。資料來源健保局倉儲系統健保局總國衛院局健保局各全民健康保分局彙總檔險學術研究資料庫明細檔醫療院所申報費用相關資料磁帶圖1-1健保資料流程1第一章緒論現在向國衛院申請健保資料,從國衛院收到申請案起,經過審查作業到通知審查結果約一個月的作業時間[國衛院00/5],最後寄發光碟片,需在兩個月內提供。也就是說從一個問題形成到收到資料可以分析,很有可能要超過兩個月,兩個月前的想法,就算沒有忘記,但問題形成的前因後果恐怕也不是那麼清楚了,這還是算蠻順利的狀況,若審查程序有問題,必須補送資料,或者再發生所領到的光碟片發生挑片問題,需要重新燒錄,所花的時間將要更多。此外,健保資料庫也是出了名的大。以八十六年標準版[國衛院00/1](非特定主題分檔)而言,醫事機構、醫事人員的一些基本檔案,並不大,大的是門診、住院的醫令明細檔,以至於門診處方醫令明細檔以及住院醫療費用清單明細檔,分別以500:1及20:1的比例作系統抽樣,既使抽樣完後住院醫令仍高達6,320,416筆(表3-1)。即使這樣,這些系統抽樣檔仍無法滿足所有研究者需求,所以正式版提供的資料除了基本資料檔及系統抽樣檔外,更增加特定主題分檔。事實上,這些特定主題分檔的資料量比系統抽樣檔還龐大。當一個二、三百MB的檔案要讀入SAS檔,甚至還要合併(Join)幾個資料表才能達到所需要的資料集(dataset),對一般的個人電腦來說還是很大的負擔。從以上的觀點,大概可以說一般使用健保資料的困難之處有:1.資料取得曠日費時。2.資料量大,分析不易。3.資料的正確性、一致性;健保資料的某些變項的訊息可能會有嚴重的誤差以及它某些訊息的完整性可能有存疑[李中一00]。至於資料的完整性及正確性應該在交易性的資料庫就該解決,或者彙總到資料倉儲時,資料的轉換中亦可獲得處理,但在實際處理過程中顯然還有這類問題,可是這些並非本論文所要討論的重點,本論文假設在國衛院的「全民健康保險學術研究資料庫」已是完整乾淨的資料庫。2第一章緒論第二節研究目的鑒於上節所描述的缺點,本研究目的就是希望能提出適當的資料取得方式,更方便的資料分析流程,提供衛生醫療界的管理者、研究者甚至一般對健保醫療資訊有興趣的民眾,藉此向國家衛生研究院的全民健康保險學術研究資料庫取得資訊,增加分析的產能。1.建構以網路為基礎的資料倉儲、資料超市系統。設計資料的呈現以超文字標記語言(HypertextMarkupLanguage,HTML)的方式,可在瀏覽器的介面上呈現,可在任何時間,任何地點回答使用者的問題。2.三層式架構設計,將前端定位在詢問的輸入及報表的產出,將資料的計算移至後端資料庫,降低使用者的使用設備門檻。3.使用線上分析系統(OnLineAnalyticalProcessing,OLAP),提供普遍一般性的圖形詢問介面,讓使用者能以直覺的方式配合點選拖拉的操作介面,不需經過程式設計寫作就能輕易達到詢問的機制,降低使用者門檻。4.設計分析長模,作為未來健保資料倉儲、資料超市的設計參考。我們試著運用資料倉儲的原理與技術,重新設計適合以主題導向的分析性資料庫,配合線上分析系統實作應用於網際網路上。第三節研究限制資料的正確性;若原始資料就是錯誤的,當然整理出的資訊就有問題,但本論文的重點在於資訊的產生方式,是不是能比以往更快速方便,故對於資料的正確性並不予以強調。由於本系統只是一個初步的資料倉儲系統,並沒有對大部分行政、研究者作使用需求分析,所以它以主題導向僅能滿足部分主題使用者。在實作系統過程中,為了使就醫資料能與醫事機構及醫事人員串聯,歸戶的過程中(附錄)將同一主治醫師、醫事機構科別視為規戶的要求,因此若定義在3第一章緒論同一家醫院住院過程中轉科,視為同一次就醫的話便會出現兩筆以上的就醫資料。如此就可能對就診人次造成高估,但不影響醫療費用的計算。也就是說本系統,轉科定義為不同次的住院問題。4第一章緒論第四節研究流程此論文的研究流程從尋找問題開始,到界定研究範圍,以至完成系統論文撰寫,過程如圖1-2所示。尋找問題界定題目健保資料庫使用資料倉儲系統之狀況分析文獻探討界定研究目的與範圍決定資料倉儲實行架構系統設計與實作系統測試結論與建議圖1-2研究流程5第一章緒論第五節論文架構依據上節的研究程序,本論為共分六章,各章節主要內容說明如下:第一章為緒論,主要說明研究背景與動機,研究目的,研究限制,研究流程與論文的整體架構。第二章為文獻探討,主要說明研究的理論背景,藉由回顧國內外相關文獻以及討論現行的事實情況,作為本研究的理論基礎與研究方向。依據此結果發展出本研究的觀念性架構。第三章為系統架構設計與實作,本章根據第二章的探討,選定特定的理論基礎與研究範圍,實際規劃、設計並實作本系統。第四章為成果展示,本章在測試執行本系統是否能達到第一章所預期的目標。並向使用者說明如何使用本系統。第五章為討論,主要在說明實際製作過程中所遭遇到的困難,與實際使用上可能出現的錯誤。第六章為結論與建議,本章說明此系統與原先目標的差異、系統製作關鍵之處,再依此及未來的遠景提出自己認為後續研究的建議。6第二章文獻探討第二章文獻探討目前有很多的大型機構,包含國內都已經建構了資料倉儲系統,即使還沒有建立此類系統的企業,也都在審慎的評估當中。但因為醫學界的背景特殊,「醫院」是一相當封閉且完整的組織型態,外來的文化(如資訊文化)必須花非常多的時間與精神才能與之融合[杜屏瑩99]。目前已有900家軟、硬體及服務供應商正專攻此資料倉儲領域[WATS98]。在國內儘管資料倉儲已漸漸受到重視,但還並未多見各醫療院所積極的採用或評估此種新的企業領域。從檔案型的電腦儲存開始,電子化的檔案大大減少了資料儲存空間,也加快了資料交易的時間與方便。隨著計算機工業的快速發展,資料儲存電子化,交易自動化,衍生而來的就是更多更方便的電子資料,更強更大的交易系統及交易量。自健保開辦,每年累積龐大的健保就醫資料,為了處理這些埋在健保資料的知識,健保局、衛生署、國衛院,紛紛投入這種以詢問機制為主要目的資料倉儲系統。本章主要在藉著過去的文獻說明資料倉儲的理論基礎,以及目前健保資料的使用情況。7第二章文獻探討第一節資料倉儲概論壹、資料倉儲的發展過程企業最初的資料處理,事實上是檔案處理,也不見得是電子化的處理方式。這時期無所謂的資料庫系統。而直到所謂的作業處理系統(operationalprocessing)出現。早期的企業資料庫的應用,主要集中在一統一控管的資料處理中心,管理一個單一的資料庫。此系統我們通稱?交易處理(transactionalprocessing)或線上交易系統(on-linetransactionprocessing;OLTP)。隨著資訊科技的演進,我們所能紀錄、能獲得的資料暴增。資料庫開始扮演另一種不同的角色,不在僅限於企業的日常運作、資料的紀錄與維護;資料庫提供著資訊分析需求[INMO96]。決策支援系統(decisionsupportsystem;DSS)、專家系統(expertsystem;ES)、策略資訊系統(strategicinformationsystem;SIS)、主管資訊系統(executiveinformationsystem;EIS)等,企業的策略決定、管理架構變的跟以往不同,此階段資料的成本降低,同時也帶動資訊的成本降低,決策人員開始意識到要大量使用分析資料,利用資訊已成?企業管理必要的課題。但是這時候的資訊是片段的,系統的各自獨立致使所建立的資訊系統只能提供單一功能或觀點的資訊,被稱之?”資訊孤島”(informationisland)或”功能孤島”(functionisland)。[CHOR97];[INMO95,96,97]。這時候在跨部門、功能別資料或區域分公司,依然有著相當程度的阻力。尤其是通常這樣的資料查詢分析,會影響到原來的日常交易系統。因?這種詢問機制通常臨時性而高資料量的處理一個企業問題,很容易就讓日常交易資料庫停擺。在1960年代美國麻省理工學院?了研究計量經濟學相關課題,發明了多維度模式(multidimensionalmodeling)[蘇堤98];但直到1990年有資料倉儲之父(FatherofDataWarehouse)之稱的BillInmon對資料倉儲提出了較完整的定義[INMO94]。而此時企業面對市場劇烈的變化,?生了對消費者分析的大量需求,而這類分析所需要的大量客戶交易資料、分析法則以及電腦資源需求,促使了此領域的蓬勃發展。8第二章文獻探討事件?品技術1984Computerworld指TeradataDB/DC1012出:兩種資料庫形式在業界出現1986AMS建立PacTel及DEC的技術架構藍皮BurlingtonNorthem書問世資料倉儲系統1988QED出版“BuildingtheDataWarehouse”一書1990BarenttDataSystems召開第一次資料倉儲會議1992IBM,HP,Tandem宣佈投入資料倉儲市場1994第一個獨立Prism提出第一套資OLAP/ROLAP工具(independent)資料超料整合及轉換工具問世市誕生1996第一個相依網際網路介面的資料(dependent)資料超採擷工具問世市誕生表2-1資料倉儲成長史資料來源[INMO98]貳、資料倉儲及資料超市的定義1.Inmon在1990年從技術上的觀點來定義資料倉儲:以主題導向的(Subject-Oriented)、整合的(Integrated)、隨時間變異的(TimeVariant)以及非暫存性的(Nonvolatile)資料搜集,來支援管理決策[INMO94]。2.[THEI98]:資料倉儲是一個資料儲存、查詢、及分析的引擎。3.[KELL96,97]:資料倉儲是一個直接對應全企業或企業中單一主題的單一資料儲存處所。9第二章文獻探討4.FinancialTimes[KELL97]純粹以企業導向來定義:資料倉儲是一個特定模式化及微調(fine-tuned)過的資料庫,來幫助企業分析資料及形成決策。5.ChorleywoodConsulting[CHOR97]提出對資料倉儲字義的一些不同的看法:資料倉儲是一種「概念」,而非一種?品!資料倉儲是一個維護多重來源,且通常是大量(voluminous)的檔案,於一個特定資料庫的概念。此外,亦需提供一些特殊工具,來輔助大量非結構(unstructured)、無規劃(unplanned)的資料擷取(extraction)作業;然而,「資料倉儲」這個術語不夠精確,「倉儲」這字眼過於被動消極(passive),祇能表達一個資料儲存中心的意義而已;以「資料工廠(datafactory)」或「資訊工廠(informationfactory)」來取代,因?透過資訊工廠內人員,或機制適切的處理,能夠提供資料本身之外的功能及智慧,是一個強而有力(vigorous)且積極的定義。6.蘇提[蘇提98]認?:資料倉儲是一種電子資訊集中儲存的所在。不同來源、不同型態的資料經過清淨(cleansing)、轉換(transformation)後,以齊一的型態,有組織的排列儲存於倉儲(warehouse)內。廣義的資料倉儲指的是一種解決 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 (solution),除了資料集中儲存,還包括了線上分析的功能。應客戶需要,有些資料倉儲也提供資料探采(datamining)的功能。7.Kimball[KIMB96,98]以開放式的定義認?:資料倉儲是能讓人們取得他們所需的資料的地方;在企業中一個可以查詢(queryable)的資料來源;資料倉儲是一份交易資料的拷貝,並經過特別的結構化以利於資料的查詢及分析;或由技術面來說「資料倉儲是由所構成的『資料超市(datamart)』的集合」。而資料超市在邏輯上是完整資料倉儲的一個『子集合』,其構成則是:「限制資料倉儲的範圍(scope),至企業中的單一企業流程(businessprocess),或一組相關的企業流程,以提供特定的企業資訊」。8.蕭凱文、薛志達、李政輝[蕭凱文99]等人認為:資料倉儲是將企業內異質性的資料加以合併,將歷史資料抽出,來輔助決策分析。綜合以上各位學者及學習所得,我們可以歸納出資料倉儲的特色:1.資料倉儲的目的是?了讓資訊需求者,能快速無障礙取得所需要且完整的資訊的一連串設計與技術,包括後端的資料庫設計及前端資10第二章文獻探討料呈現方式。2.資料倉儲牽涉到資料庫設計的基礎技術。與一般資料庫不同在因?使用者的角度不同所以設計上有其基本的差異。3.資料超市基本上為資料倉儲的子集合,所以在設計上差異性並不大。通常資料超市較限制于單一主題或是單一企業流程,所以常是以一種部門別存在於資料倉儲。參、資料倉儲與線上交易系統之差異交易系統與資料倉儲或者說關聯式資料庫與多維式資料庫(Multi-DimensionDatabase,資料倉儲中最廣泛使用的應用方式)在應用方式、系統設計理念、資料庫使用者等方面都不同,我們必須瞭解這些差異才能分辨使用時機,才能在系統開發時抓到系統設計的精髓。1.應用方式;傳統的資料庫主要應用於線上交易系統或批次交易系統,而多維式資料庫則廣泛應用於資料倉儲及線上分析,這種應用上的差異導致他們在系統設計與最佳化有很大的不同。一般交易性的系統有以下特徵[林存德99/1]:l以交易?導向,強調資料交易(新增、刪除、修改)的快速與穩定。l可同時多人使用,後端資料庫必須有能力承載多人同時使用,並仍保持良好的交易速度。因?多人使用,資料庫管理系統也都具備良好的一致性及存取性控制。l具有強大的資料庫管理功能,如安全控管、績效控制、上線人數、系統最佳化設定等。l注重資料保存,發展出資料複製(DataReplication)、資料庫備份、設備鏡射(DeviceMirror)、資料復原等技術,以確定資料的安全與完整。l技術人員導向設計,因?資料庫牽涉到相當多的技術與理論,只有技術人員能運用適當的電腦語言來控制資料庫。l強調資料庫正規化,目前大多數的資料庫處理系統都是關聯式系統,此種系統會有較少的重復性資料,使資料在交易時更能達到交易的一致性。因此系統設計會有較多的表格而較少的欄位。l以結構化查詢語言(StructuredQueryLanguage;SQL)?標準的存取語言,目前的市面上領導的資料庫系統都使用結11第二章文獻探討構化查詢語言?其資料的標準控制語言。所以傳統資料庫的使用對一般人而言還是有一段距離,一般人必須要有關聯式資料庫的概念以及瞭解結構化查詢語言才能操作於這些線上交易資料庫。這種資料庫不適合對大量資料查詢或對大量資料表格合併執行也會效率不佳,以及缺乏良好的資料分析工具。而資料倉儲最主要在解決資料庫管理系統的兩大難題:即時線上資料分析及用戶直接操作,而不是資訊管理系統人員(ManagementInformationSystem,MIS)來操作。資料倉儲經由資料庫的重新設計、採用新的索引技術、及提供線上分析工具來彌補線上交易系統在查詢上的不足。l資料庫的重新設計;由於資料倉儲最大的目的就是在查詢,因此較不需顧慮新增、刪除等異常問題,所以對資料的正規化要求就不高。由資料庫的設計觀點,由於合併表格的次數減少,(多維式)資料庫本身不需顧忌異動、鎖定及交易日誌等問題,資料擷取速度上已經比關聯式資料庫快很多。l新的索引技術;資料倉儲通常是相當大量的資料,傳統的Hash、B-tree索引技術較適用於重複性不高、資料查詢量不大的情況。目前已經發展許多新的技術可以處理大量資料的查詢問題,包括Balanced-treeindexing(改良式B-tree)、Bit-mapindexing(以bit為索引單位,用於資料重複性高的時候)、Bit-wiseindexing(以32或64bit-map的方式建立索引)、Joinindexing(事先將常用的合併表格定義好,並事先載入)、R-treeindexing(用於與地理方位有關的系統)等。l提供用戶自行查詢的工具;大部分的用戶可以不經MIS人員就能使用線上分析資料。如Oracle的Develop/2000、SAS的SAS/INSIGHT、MSSQLServer的OLAPServer都推出交談式分析工具。2.系統設計理念;關聯式資料庫的設計角度是將分析作業流程所得到的交易資料,經由適當的分割將其間的關係切乾淨,並以關聯表達資料間的關係,以減少資料新增、刪除的衝突,此過程就是正規化。它是以技術理論來設計資料庫。而多維式資料庫卻是從”使用者會從哪些觀點、哪些層級來分析資料”,主要的設計方法是將用戶12第二章文獻探討的需求以觀點及層級方式表達出來,此種設計方式又因為考慮到資料讀取效率,通常對正規化的要求不高。3.存取速度最佳化方式;線上交易式資料庫強調交易的快速與安全,查詢反而是次要的重點,因此存取的最佳化主要是從資料鎖定及索引兩方面著手。資料倉儲由於分析的資料量較大,傳統的設計恐怕無法滿足大量查詢的需求,故各知名的資料庫廠商大多自行開發利用新的索引技術(如SybaseIQ的Bit-Wise)。4.一致性觀點;線上交易系統及資料倉儲兩者都很強調資料的一致性,但線上交易系統的一致性是微觀的,強調每筆交易系統是否完整處理;而資料倉儲卻是巨觀的,強調載入的資料是否完整一致。5.交易處理次數;線上交易系統一天可能有上千萬次交易資料,但每次資料量比起資料倉儲來說就小的無法比較。而資料倉儲的交易並非線上即時交易,通常為批次處理,最多一天一次,甚至可能一月或是一季一次。OLTP的系統使用率資料倉儲的系統使用率系統利用率系統使用率時間時間圖2-1資料倉儲與線上交易系統對系統資源使用情形差異資料來源[蘇隄98]13第二章文獻探討第二節健保資料倉儲現況分析壹、中央健康保險局自民國八十四年健保開辦,健保局就必須每月處理各醫療特約機構所申請的醫療費用,因此也造就了大量的全國醫療資料。這些資料不僅可以提供日常申請稽核作業所需,隱含的知識價值更是?許多研究者所注意。健保局?了本身營運的目標當然是首先的使用者,其規劃的健保資料倉儲系統主要描述如下[健保局98]:1.導入背景過去健保局若要從健保資料擷取有用的資料,以研究回答相關問題,所需要的程序必須經過(圖2-2):l從分局資料庫擷取資料。l資料必須經過適當的減量分段傳至個人電腦端彙整。l由使用者自行整理分析,回答特定的問題,有可能進一部產生新的需求。這種情況相當耗費時間、人力及網路資源。且使用者必須有相當的資料處理能力來整理各個匯集過來的健保資料檔。這說來簡單,但是有經驗的人都知道這是最耗時間與精力的。各健保分局新需求影響分局例行性作業台北分局資料變動性高各健保分局分段傳至回答特定問PC端彙整題資料定義差異性北區分局網路限制中區分局資料需減量圖2-2傳統健保資料提供方式14第二章文獻探討因此中央健保局迫於行政上的需要規劃自己的資料倉儲系統希望能達到:l支援健保規劃及分析需求。l加速資料統計分析處理,建立分析模式與決策輔助系統有效整合。l提供主管及分析人員一致資訊。l建立完整性全國醫療資訊。2.建置過程l86/04-86/10公開招標,系統建置作業。l86/11-87/04資料載入,成立規劃工作小組。l87/06開啟資料字典(DataDictionary)企業網站查詢。l87/08-87/12導入即興查詢(Ad-hocquery)工具軟體。l88/01正式開放連線使用。總、分局資訊人員及業務分析人員分局資料使用者回饋BTEQ查詢局內使用者WebEIS彙總檔SAS工具SAS分析需求統計模型外部戶籍資料轉檔、轉碼資料載入明細資料Ad-hocquery欄位檢核關聯性檢查GQL主題術研究單位衛生署、國家衛生研究院、各學分析模型例行(外界使用者戶籍、財稅報表…BTEQ查詢..一般性彙Metadata總資料…DataDictionary資料索取)資料處理資訊處理應用面圖2-3健保局資料倉儲作業流程[健保局98]15第二章文獻探討目前健保局的資料倉儲設備為NCR主機5100M超併列系統,56*CPU(中央處理器),14GBram(動態隨機存取記憶體),7node(電腦叢集伺服器節點),資料庫空間為1TB,6具磁帶備援機(DLT4000)、2具DLT7000磁帶機,磁碟陣列系統為NCR6257。此架構係以NCR主機(nhi_b3)為客戶端(Client),Windows2000AdvancedServer為伺服器端(Server),因此所有資料建置處理流程均源發自NCR主機。當Teradatatable預備好之後,產製Teradatatable的shellscript會自動呼叫並執行建置SASMDDB的shellscript,此shellscript分為Create/RebuildMDDB及AppendMDDB兩大類[健保局99]。Windows2000MDDBServerNCR(nhi_b3)SignonTeradataSAS/EISSAS/EISSAS/EIS圖2-4中央健保局資料倉儲系統主架構3.系統成果l提高資料之一致性與正確性l加強分局資料來源之正確性l縮短資料分析所需之時間與程序l完成全國歸戶作業l提供醫療費用追蹤管理與費用監控之利器l人員做更有效率的分工l協助醫療相關政策之制定16第二章文獻探討貳、衛生署嚴格說起來,衛生署的健保資料倉儲還並未是一個完整的資料倉儲系統。目前此資料系統僅提供資料供使用者自行分析,且提供的方式,還是需要MIS人員為其分檔擷取。但其並非是一個以交易為主的線上交易系統,仍然是以分析為主的資料庫。此健保資料倉儲系統於八十七年一月起用,原系統建置於IBMRS6000主機上,資料庫為ORACLE7.X版,此系統是委託資策會開發,但在民國八十八年一月則由衛生署自己的資訊中心來承接維護。因為設備的速度緩慢,資料量又相當的大。衛生署於同年購置NCR主機,將系統換置於Teradata,系統狀況大致如下:NCR主機4800為2node,資料庫名稱為NHI、空間約有100GB,資料期間為八十七年一~六月健保資料。目前除了衛生人口資料管理系統外,並沒有其他固定提供的應用系統,所以主要的角色扮演仍然處於資料的提供者,並非為資訊的提供者。參、國家衛生研究院如第一章所述,國家衛生研究院的資料是由中央健保局提供,而中央健保局基於安全考量,僅提供部分資料供學術界利用。目前國衛院規劃的資料倉儲所提供的服務也在於資料的分檔提供,類似於衛生署的資料擷取觀念,還未實際導入資訊產出,資料描述整理如下[國衛院00]:1.資料庫狀況描述醫事機構檔案;包含醫事機構基本資料檔、醫事機構副檔資料檔、醫事機構診療科別明細檔及醫事機構病床主檔。這四個檔案都是全檔,因為健保資料庫提供以年作單位,所以此檔為當年某時間的快照(snapshot),並未牽涉到異動。當醫院有所更新,異動的資料自然覆蓋舊的檔案。必須將前後年的資料串聯才能知道異動的情況。醫事人員檔案;包含醫事人員基本資料檔及專科醫師證書主檔。醫事機構檔一樣也是提供全檔,但也是一年僅提供一次,故也無法單從17第二章文獻探討一年知道異動狀況。保險申報資料檔;這方面主要分為住院、門診及較特殊的重大傷病三部分,住院有住院費用申請表主檔、住院醫療費用清單明細檔以及住院醫療費用醫令清單明細檔。門診則有門診費用申請總表主檔、門診處方及治療明細檔、門診處方醫令明細檔、特約藥局處方及調劑明細檔以及特約藥局處方調劑醫令檔。醫事機構單位每個月會向健保局申報,因此基本上門診及住院費用申請總表主檔每月每個醫事機構都會更新,而各清單明細檔紀錄病患每一次住院、就診紀錄。而針對每一筆治療明細所產生的醫令當然紀錄在各醫令明細清單上。重大傷病明細檔則以病患的「ID」及「ID_BIRTHDAY」與門診住院相串聯,但並不保證串聯的上。還有一項值得一提的是,住院部分疾病代碼以ICD9CM為主,而門診卻是A-code及ICD9混用。2.硬體設備架構l主機:SUN4000lcup:Sparc4*250MHz,八十八年更新至8*336MHzlram:4GB,八十八年更新至5GBl磁碟空間:425GB,八十八年更新至1.36TBl30捲自動磁帶櫃l二台DTL磁帶機(TapeDriver)l二部陣列式磁碟機(DiskRaid),控制器由一片SCSI控制卡分別升級為兩片SCSI控制卡(傳輸速度40MB/sec)及光纖(Fiber)控制卡(傳輸速度200MB/sec);有關ORACLE檔案系統,將SUN檔案系統升級為Verita檔案系統[國衛院99/7]。3.資料庫的特色與限制目前此資料庫所存的資料是各醫事機構依據他對被保險人的服務量,所產生出來的健保金額給付申報資料,並非是為了研究所產生的資料,既然目的不同,就必然會有相當程度上的差異,如它可能沒有研究者所需要的變項,它某些變項的訊息可能會有嚴重的誤差。並未歸戶處理。同一個醫師可能在醫師基本資料檔有好幾筆資料,相同的醫事機構也有這種現象,最麻煩的是一個人每次就醫也不見得只有一筆資料,可能因為補報、同一療程等其他因素而出現多筆資料。18第二章文獻探討個人、醫事機構、醫事人員等資料經過加密,無法與其他生命統計資料、行政相關檔案串聯。故研究人員很難再擴大與其他資訊連結。目前暫時不提供承保檔、財務統計檔、個人歸戶資料。所以能分析的的主題便有一定的限制,如沒有承保資料,難以對全國疾病率或特殊人口作完整的分析。4.資料庫現行的申請使用狀況目前此資料庫僅限於研究使用,使用者符合其規定的身分、按其作業流程就可以申請此資料庫的資料,參考國家衛生研究院網頁http://www.nhri.org.tw/nhird/appl.htm。從研究者寫完必要的表格、計劃、申請單後以掛號寄出開始,需經過申請者資格審查、文件審查、計劃審查、資料擷取與燒錄、資料內容及費用確認、繳費最後一律以光碟片的形式寄出。預估這些工作要二個月內完成,當然不包括文件資料補正、光碟資料無法讀取需從新燒錄等其他不順利時所必要的行政程序。如今從此資料庫申請的計劃已有78件[李中一00],圖2-5。可看出目前大多數的學者(47,60%)研究的方向仍然以健保政策經濟財務面為主。19第二章文獻探討環境/職業衛生資料倉儲/資料拮取4/5%5/6%臨床/用藥/流病22/28%管理/政策/財務/經濟47/60%圖2-5利用「全民健康保險學術研究資料庫」進行醫藥衛生相關研究主題分佈20第二章文獻探討第三節健保資料庫潛在的分析價值在國家圖書館「全國碩博士論文摘要檢索系統(http://datas.ncl.edu.tw/)」以”健保”兩字為關鍵字查詢共有109筆資料;以”健保”+”資料庫”檢索,雖然有35篇論文,但瀏覽其摘要後,並沒有關於針對健保資料倉儲設計的文章;以”健保”全域檢索配合”資料倉儲”為關鍵字,也沒有一篇論文(2000/8/6)。可見目前此一領域還是缺乏此種資訊科技的加入。目前國衛院與健保局傾向健保研究資料單一窗口化,也就是盡量將提供健保資料的角色交由國家衛生研究院辦理。而目前國衛院所接受申請的研究計劃還不到100件,這之中可能還包含已執行完畢的。中央健保局雖然已有自己的資料倉儲系統,但一般人無法得知其設計要點,此外我們可以知道的是此資料倉儲系統還是走較傳統的主從式架構(Clinet/server),還未有網際網路化的解決方式,而且其使用的資料倉儲系統為SAS公司所開發,SAS公司因為並非是資料庫出身的公司,所以其資料倉儲系統不是對資料庫本身的設計下手,而是走SAS公司自己本身專屬的索引方式,資料必須先轉成SAS所能讀取的檔案 格式 pdf格式笔记格式下载页码格式下载公文格式下载简报格式下载 ,這種方式與本論文的解決方式截然不同。雖然從八十六年資料,可以看出健保資料雖然仍有很多問題(如資料的正確性包含紀錄及轉換擷取過程,一致性等許多邏輯上的合理性),但一般相信健保資料會越來越完整正確,何況越多使用者的利用,越能促進健保局及國衛院對資料的改善。我們相信在未來健保資料絕對會是越來越正確,資料量也隨著時間的增長會越來越龐大。在這樣的過程中對有志於我國健保上的分析,不管是醫管、衛政、臨床、流病等都是很大的機會與挑戰。套1999年研究資源週宋鴻樟教授演講的結語「對研究者而言,應用二手資料之成本很低,應用時,靠著極富創意的分析方法,仍可能會有意外的收穫。」我更強烈的相信,隱藏淹沒在這龐大的健保資料內必有相當大的寶藏等我們去發掘,而資料倉儲正式目前科技處理這方面的利器之一。21第三章系統架構設計與實作第三章系統架構設計與實作本研究中,將以Kimball,Reeves,Ross,andThornthwaite[KIMB98]提出的『企業維度生命週期』方法論(BusinessDimensionalLifecycle;BDL),作為本主題專案的建置架構。選擇『企業維度生命週期』來設計,原因是其完整的涵蓋了管理面及技術面的課題,且是目前所知較完整且公開見諸於文獻的建置架構。如圖3-1,完整的解釋資料倉儲企業維度生命週期發展程序。技術領域技術架構產品選擇及設計安裝資料領域企業需求專案規劃維度模式資料庫資料集結系統維護系統部署定義設計實體設計設計及開發成長管理應用領域使用者使用者應用程式規劃應用程式開發專案管理圖3-1BDL資料倉儲開發方法論資料來源[KIMB98]22第三章系統架構設計與實作第一節專案規劃壹、健保資料倉儲專案定義因為人力及時間的壓力,本專案主要還是架構在單一主題的『資料超市』。根據上一章所討論可以知道目前的研究還是以政策、財務及經濟居多,所以主題就選定在住院及門診費用分析。貳、預期目標1.提供使用者一個簡易不需預設的使用環境;能提供非常有彈性的查詢介面,從不同的觀點,醫院、醫事人員、民眾、特定時間甚至是特定疾病的情況下查詢。只要能連上網際網路,使用者不受時間、地點設備的多餘限制,都能有效的利用本系統。2.提供彈性、易於開發不影響日常交易行為的資料倉儲架構;利用Kimball維度模式(DimensionModel)的資料倉儲開發理論,將資料倉儲從線上交易資料庫中獨立出來,較有彈性,清楚的主題導向,較佳的查詢效能及不影響日常交易行為的資料庫。3.提供網際網路系統架構;為了易於維護,採用三層式架構,僅需維護系統的商業邏輯層(BusinessLogicLayer)及後端資料庫(DataAccessLayer);又為了易於散佈,必須要考慮使用者可以很容易取得工具。而網際網路正適合這種設計。因為是網際網路的三層式架構,使用者前端僅需要一般普遍的網際網路瀏覽器就可以執行查詢,而且目前網際網路正風行世界,使用者應該可以較快及較容易接受使用介面。4.提供線上分析的使用者介面;目前提供資料倉儲的設計也必定會同時提供線上分析的方法,可以說線上分析是資料倉儲的一部分。利用事先規劃的多維度分析開發資料倉儲的資料庫部分,使用線上分析系統釋放資料倉儲的能量,將資料倉儲的資料轉換成有用的資訊。5.此線上分析系統
本文档为【设计制作以网际网路架构为基础的健保资料仓储系统-以医】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
百万精品文库
暂无简介~
格式:pdf
大小:1MB
软件:PDF阅读器
页数:141
分类:交通与物流
上传时间:2022-09-27
浏览量:0