国产在线99爱视频|亚洲AV成人久久无码|亚洲日韩成人片在线播放|精品日韩二区三区精品视频|国产精品成人麻豆视频网站|亚洲午夜AⅤ视频在线天堂|国产亚洲精品成人a·v久久|精品国产一区二区三区每日更新

鄭州華泰聯(lián)合工業(yè)物聯(lián)網(wǎng)云平臺(tái)

掃一掃關(guān)注

大變局:國(guó)產(chǎn)數(shù)據(jù)庫(kù)的機(jī)遇與挑戰(zhàn)|深度研報(bào) - OFweek云計(jì)算網(wǎng)

   2022-04-02 OFweek電子工程網(wǎng)ofweek7700
導(dǎo)讀

就在本月,烏克蘭副總理兼數(shù)字化轉(zhuǎn)型部長(zhǎng)Mykhailo Fedorov在推特上曬出了發(fā)給Oracle和SAP的兩封信,希望其終止與俄羅斯的商業(yè)關(guān)系。Oracle隨后發(fā)推文稱:“為了Oracle在全球各

就在本月,烏克蘭副總理兼數(shù)字化轉(zhuǎn)型部長(zhǎng)Mykhailo Fedorov在推特上曬出了發(fā)給Oracle和SAP的兩封信,希望其終止與俄羅斯的商業(yè)關(guān)系。Oracle隨后發(fā)推文稱:“為了Oracle在全球各地的150000名員工的利益,為了支持烏克蘭民選政府和烏克蘭人民,Oracle公司已經(jīng)暫停了在俄羅斯聯(lián)邦的所有業(yè)務(wù)?!?/p>

俄羅斯的遭遇給了中國(guó)很大警示,在當(dāng)前國(guó)際貿(mào)易摩擦加劇、國(guó)際局勢(shì)多變的情況下,數(shù)據(jù)庫(kù)軟件作為最重要的IT基礎(chǔ)設(shè)施之一,中國(guó)必須實(shí)現(xiàn)國(guó)產(chǎn)化和自主可控,由此也引發(fā)了近年來(lái)國(guó)產(chǎn)數(shù)據(jù)庫(kù)的創(chuàng)業(yè)投資浪潮。

作者丨王圓珍

本報(bào)告由勢(shì)乘資本和光錐智能聯(lián)合發(fā)布

本報(bào)告成文于2022年3月

研究提綱:

01 核心結(jié)論匯總

02 市場(chǎng)環(huán)境

l 數(shù)據(jù)庫(kù)行業(yè)的定義及邊界

l 行業(yè)常見(jiàn)名詞釋義

l 行業(yè)歷史及階段

l 市場(chǎng)需求及價(jià)值

l 市場(chǎng)規(guī)模及增速

l 市場(chǎng)增長(zhǎng)的驅(qū)動(dòng)因素

03 產(chǎn)業(yè)鏈與行業(yè)格局

l 產(chǎn)業(yè)鏈及行業(yè)圖譜

l 行業(yè)集中度

l 競(jìng)品分析/對(duì)標(biāo)/推薦項(xiàng)目

l 行業(yè)的決勝要素

04 國(guó)外相關(guān)公司

05 推薦標(biāo)的

核心結(jié)論匯總

(1)數(shù)據(jù)庫(kù)行業(yè)云化趨勢(shì)顯著,所有數(shù)據(jù)庫(kù)都可直接上云,云原生架構(gòu)最具優(yōu)勢(shì)。Gartner預(yù)計(jì),到2021年,云數(shù)據(jù)庫(kù)在整個(gè)數(shù)據(jù)庫(kù)市場(chǎng)中的占比將首次達(dá)到50%;而到2023年,75%的數(shù)據(jù)庫(kù)要跑在云平臺(tái)之上。

(2)國(guó)產(chǎn)數(shù)據(jù)庫(kù)存在廣泛替代空間。目前,國(guó)產(chǎn)數(shù)據(jù)庫(kù)主要應(yīng)用還是在黨政軍領(lǐng)域。國(guó)產(chǎn)數(shù)據(jù)庫(kù)長(zhǎng)期被Oracle、IBM、MySQL這類產(chǎn)品擠壓,隨著中美貿(mào)易戰(zhàn)的升級(jí)、國(guó)家鼓勵(lì)軟件國(guó)產(chǎn)化,國(guó)產(chǎn)軟件將會(huì)越來(lái)越被重視,這將是一大轉(zhuǎn)變契機(jī)。

(3)我國(guó)公有云、私有云、混合云將長(zhǎng)期共存,云數(shù)據(jù)庫(kù)作為基礎(chǔ)性產(chǎn)品,需要支持跨云、多云、混合云。初創(chuàng)廠商具備云中立優(yōu)勢(shì),可以避免客戶被過(guò)度綁定,提供多云支持,拉動(dòng)客戶增長(zhǎng);很多公司并未采用單一的云廠商,他們的大多數(shù)業(yè)務(wù)都運(yùn)行在混合環(huán)境和多云環(huán)境中。

(4)湖倉(cāng)一體成為發(fā)展熱點(diǎn)。「湖倉(cāng)一體」是一種新型開(kāi)放式架構(gòu),將數(shù)據(jù)湖極低成本存儲(chǔ)大量數(shù)據(jù)和數(shù)據(jù)倉(cāng)庫(kù)高性能進(jìn)行大量數(shù)據(jù)處理的優(yōu)勢(shì)充分結(jié)合,通過(guò)一套架構(gòu)、一個(gè)集群、一份數(shù)據(jù),真正消除數(shù)據(jù)孤島。

(5)大數(shù)據(jù)與數(shù)據(jù)庫(kù)一體化趨勢(shì)明顯。用戶可直接用SQL處理海量數(shù)據(jù)對(duì)廠商有以下需求:1.內(nèi)核引擎強(qiáng)勁,一定性價(jià)比對(duì)外輸出海量數(shù)據(jù)分析處理能力;2.生態(tài)工具要完善。

(6)場(chǎng)景端時(shí)效性要求倒逼數(shù)據(jù)庫(kù)廠商提升產(chǎn)品性能,產(chǎn)品性能持續(xù)領(lǐng)先是決勝要素之一。產(chǎn)品硬核實(shí)力及成熟度是決定營(yíng)收規(guī)模及增長(zhǎng)的主要因素。

(7)分布式數(shù)據(jù)庫(kù)快速發(fā)展。分布式數(shù)據(jù)庫(kù)物理上更貼近業(yè)務(wù)部門,可以降低通信成本;同時(shí)增加數(shù)據(jù)的適當(dāng)冗余,因?yàn)橐粋€(gè)地方出了故障不會(huì)引起整個(gè)系統(tǒng)崩潰。

(8)智能化運(yùn)維助力數(shù)據(jù)庫(kù)智能調(diào)優(yōu)。啟發(fā)式機(jī)器學(xué)習(xí)技術(shù)給予海量運(yùn)行數(shù)據(jù)形成智能運(yùn)維模型,自動(dòng)化處理各項(xiàng)任務(wù),例如自動(dòng)管理計(jì)算與存儲(chǔ)資源、自動(dòng)防范惡意訪問(wèn)與攻擊、主動(dòng)實(shí)現(xiàn)數(shù)據(jù)庫(kù)智能調(diào)優(yōu)。

(9)開(kāi)源策略成為部分廠商吸引用戶、盤活生態(tài)和促進(jìn)技術(shù)發(fā)展的重要手段。通過(guò)將底層技術(shù)開(kāi)源,可以吸引更多人開(kāi)發(fā)、測(cè)試、維護(hù),不僅可以降低廠商售后和服務(wù)的成本,還可以進(jìn)一步提高軟件質(zhì)量,同時(shí)有利于構(gòu)建生態(tài)。

(10)One size cannot fit all。雖然混合事務(wù)分析HTAP在中等規(guī)模客戶的應(yīng)用已成為熱點(diǎn)研究方向。但HTAP價(jià)值在于更加簡(jiǎn)單通用,對(duì)于中等數(shù)據(jù)量規(guī)模用戶可滿足需求,對(duì)于超大型企業(yè)數(shù)據(jù)分析性能可能不如OLAP。

(11)更多利用硬件發(fā)展紅利是必然趨勢(shì)。計(jì)算需要GPU加速,存儲(chǔ)方面持久存儲(chǔ)(NVM)代替硬盤存儲(chǔ),需要重新設(shè)計(jì)架構(gòu)利用特性;存算分離執(zhí)行路徑變長(zhǎng),數(shù)據(jù)庫(kù)需采用高性能網(wǎng)絡(luò)等。

(12)其他:OLAP和NoSQL將是主要的創(chuàng)業(yè)和投資方向。在國(guó)產(chǎn)數(shù)據(jù)庫(kù)的OLTP領(lǐng)域,華為、阿里、騰訊等廠商有技術(shù)優(yōu)勢(shì)和資金優(yōu)勢(shì),同時(shí)也有生態(tài)和渠道的優(yōu)勢(shì),創(chuàng)業(yè)公司進(jìn)入OLTP領(lǐng)域門檻非常高,而在 OLAP領(lǐng)域,建立新一代數(shù)據(jù)倉(cāng)庫(kù)以及NoSQL數(shù)據(jù)庫(kù)方面,未來(lái)會(huì)涌現(xiàn)更多的創(chuàng)業(yè)公司,這塊可能是很多投資機(jī)構(gòu)接下來(lái)要重點(diǎn)關(guān)注的方向。

市場(chǎng)環(huán)境

1. 數(shù)據(jù)庫(kù)的定義及邊界

數(shù)據(jù)庫(kù)管理系統(tǒng)是各類信息系統(tǒng)不可或缺的基礎(chǔ)性平臺(tái),主要任務(wù)是對(duì)數(shù)據(jù)的歸集、分類、組織、處理、存儲(chǔ)、分析、應(yīng)用的全生命周期提供共性技術(shù)支撐。

數(shù)據(jù)庫(kù)大致可以由內(nèi)核組件集與外部組件集共同組成,其中外部組件集以數(shù)據(jù)庫(kù)配套的獨(dú)立支撐軟件為主,例如數(shù)據(jù)庫(kù)驅(qū)動(dòng)。內(nèi)核組件集則一般可以分為管理、網(wǎng)絡(luò)、計(jì)算和存儲(chǔ)四大模塊。

(1)存儲(chǔ)組件:負(fù)責(zé)數(shù)據(jù)持久化存儲(chǔ)的組件,對(duì)數(shù)據(jù)庫(kù)的日志、索引、堆數(shù)據(jù)等內(nèi)容進(jìn)行管理;

(2)計(jì)算組件:又可以稱為協(xié)調(diào)組件、服務(wù)組件,負(fù)責(zé)響應(yīng)數(shù)據(jù)庫(kù)訪問(wèn)請(qǐng)求,并將SQL語(yǔ)言解析成為數(shù)據(jù)庫(kù)對(duì)應(yīng)的內(nèi)部任務(wù)。計(jì)算組件在分布式、集群等架構(gòu)下也承接大部分的計(jì)算任務(wù),例如排序、聯(lián)接等;

(3)管理組件:公共組件部分,用于對(duì)數(shù)據(jù)庫(kù)全生命狀態(tài)的管理,例如心跳管理、集群管理等,以及各類中心化任務(wù)承接,如死鎖仲裁、存儲(chǔ)映射管理、元數(shù)據(jù)管理、事務(wù)號(hào)管理等;

(4)網(wǎng)絡(luò)組件:管理整個(gè)數(shù)據(jù)庫(kù)管理系統(tǒng)的網(wǎng)絡(luò)通訊的組件。數(shù)據(jù)庫(kù)的網(wǎng)絡(luò)通訊有內(nèi)部和外部之分。內(nèi)部一般指在集群環(huán)境或者分布式環(huán)境下的各節(jié)點(diǎn)之間的高速數(shù)據(jù)交換。外部一般指的是各個(gè)數(shù)據(jù)庫(kù)通過(guò)對(duì)外訪問(wèn)協(xié)議與存在于客戶端的驅(qū)動(dòng)進(jìn)行互聯(lián)的網(wǎng)絡(luò)交換;

(5)驅(qū)動(dòng)組件:支撐數(shù)據(jù)庫(kù)能正常提供服務(wù)的配套獨(dú)立組件,數(shù)據(jù)庫(kù)管理系統(tǒng)基于其通用特性,往往可以對(duì)不同語(yǔ)言開(kāi)發(fā)的軟件提供數(shù)據(jù)服務(wù)。但是由于數(shù)據(jù)庫(kù)本身只對(duì)外提供網(wǎng)絡(luò)通訊協(xié)議,對(duì)協(xié)議的封裝則由客戶端側(cè)的不同驅(qū)動(dòng)組件完成。通常有支持JAVA 語(yǔ)言的JDBC 接口、支持C 語(yǔ)言的ODBC 接口和C-API 接口等。

2. 行業(yè)常見(jiàn)名詞釋義

(1)關(guān)系型數(shù)據(jù)庫(kù):采用了關(guān)系模型來(lái)組織數(shù)據(jù)的數(shù)據(jù)庫(kù),其以行和列的形式存儲(chǔ)數(shù)據(jù),以便于用戶理解,關(guān)系型數(shù)據(jù)庫(kù)這一系列的行和列被稱為表,一組表組成了數(shù)據(jù)庫(kù)。用戶通過(guò)查詢來(lái)檢索數(shù)據(jù)庫(kù)中的數(shù)據(jù),而查詢是一個(gè)用于限定數(shù)據(jù)庫(kù)中某些區(qū)域的執(zhí)行代碼。關(guān)系模型可以簡(jiǎn)單理解為二維表格模型,而一個(gè)關(guān)系型數(shù)據(jù)庫(kù)就是由二維表及其之間的關(guān)系組成的一個(gè)數(shù)據(jù)組織。

(2)非關(guān)系型數(shù)據(jù)庫(kù):對(duì)于NoSQL并沒(méi)有一個(gè)明確的范圍和定義,一個(gè)共同的特點(diǎn)都是去掉關(guān)系數(shù)據(jù)庫(kù)的關(guān)系型特性。

(3)數(shù)據(jù)湖:是一個(gè)集中式的存儲(chǔ),允許以任意規(guī)模存儲(chǔ)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)??梢源鎯?chǔ)原始數(shù)據(jù),而不需要先轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),基于數(shù)據(jù)湖之上可以運(yùn)行多種類型的分析。

(4)數(shù)據(jù)倉(cāng)庫(kù):是處理過(guò)后的結(jié)構(gòu)化或者半結(jié)構(gòu)化數(shù)據(jù),更加靠近數(shù)據(jù)的消費(fèi)端。

(5)湖倉(cāng)一體:使用一套技術(shù)去實(shí)現(xiàn)數(shù)據(jù)湖和數(shù)據(jù)倉(cāng)庫(kù)的能力,類似多模的概念。

3. 行業(yè)歷史及階段

數(shù)據(jù)庫(kù)發(fā)展經(jīng)歷萌芽-商業(yè)化起步-發(fā)展成熟階段。

(1)萌芽階段:1960年,GE發(fā)布IDS數(shù)據(jù)庫(kù)系統(tǒng)(Integrated Database System),制定網(wǎng)狀模型語(yǔ)言標(biāo)準(zhǔn),1969年,IBM發(fā)布IMS數(shù)據(jù)庫(kù)系統(tǒng)(Information Mangement System),使用層次模型。解決了數(shù)據(jù)集中和共享問(wèn)題,用戶在對(duì)兩種數(shù)據(jù)庫(kù)進(jìn)行存取時(shí),需要指出存儲(chǔ)方法和路徑,易用性較差,沒(méi)有應(yīng)用起來(lái)。

(2)商業(yè)化起步:1970年-1980年,關(guān)系模型提出,IBM開(kāi)發(fā)出關(guān)系型數(shù)據(jù)庫(kù)System R,與之相適配的結(jié)構(gòu)化查詢語(yǔ)言SQL。70年代末,關(guān)系型數(shù)據(jù)庫(kù)在Oracle和DB2中得到發(fā)展和商業(yè)化,SQL不關(guān)注獲取數(shù)據(jù)的具體過(guò)程,把用戶從數(shù)據(jù)操作細(xì)節(jié)中解脫出來(lái),只描述想要的數(shù)據(jù)即可,成為關(guān)系型數(shù)據(jù)庫(kù)得以成功的關(guān)鍵。

(3)發(fā)展成熟(1980-1990):主要表現(xiàn)為 1、數(shù)據(jù)庫(kù)生態(tài)逐步完善,與程序設(shè)計(jì)語(yǔ)言、軟件工程、信息系統(tǒng)設(shè)計(jì)等技術(shù)互相影響;2、開(kāi)源數(shù)據(jù)庫(kù)發(fā)展,當(dāng)前2大開(kāi)源數(shù)據(jù)庫(kù)系統(tǒng)——MySQL和PostgreSQL誕生。3、OLAP開(kāi)始發(fā)展。早期數(shù)據(jù)庫(kù)處理在線交易業(yè)務(wù),被稱為OLTP(On-Line Transaction Processing);業(yè)務(wù)數(shù)據(jù)積累,OLAP出現(xiàn)(On-Line Analytical Processing);4、數(shù)倉(cāng)概念(Data Warehouse)提出。單機(jī)難以應(yīng)對(duì)爆發(fā)數(shù)據(jù)增長(zhǎng),分布式技術(shù)走上舞臺(tái)。

(4)云數(shù)據(jù)庫(kù)時(shí)代(1990-):云計(jì)算的發(fā)展帶動(dòng)各類基礎(chǔ)軟件開(kāi)始云化轉(zhuǎn)型,云原生數(shù)據(jù)庫(kù)天然具備云上的彈性、靈活性、高可用等特點(diǎn),實(shí)現(xiàn)了存儲(chǔ)和計(jì)算完全解耦,作為服務(wù)整體交付,節(jié)約了用戶管理基礎(chǔ)架構(gòu)所需的成本、時(shí)間和資源,能夠提供豐富的產(chǎn)品體系,經(jīng)濟(jì)高效的部署方式、按需付費(fèi)的支付模式。

數(shù)據(jù)庫(kù)的云化經(jīng)歷了2個(gè)階段:一是云托管,將原有數(shù)據(jù)庫(kù)系統(tǒng)部署在云平臺(tái),將數(shù)據(jù)庫(kù)服務(wù)化,按需購(gòu)買,用戶自行負(fù)責(zé)整個(gè)數(shù)據(jù)庫(kù)系統(tǒng)的可用性、安全性和性能,有自己的IT運(yùn)維團(tuán)隊(duì),有自己的數(shù)據(jù)庫(kù)管理團(tuán)隊(duì),能力要求高,人力成本投入大;二是云原生,利用云化的資源池特點(diǎn)完全重構(gòu)數(shù)據(jù)庫(kù)的層次結(jié)構(gòu),使計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等資源徹底解耦,更充分靈活利用資源池的彈性。后一階段對(duì)數(shù)據(jù)庫(kù)的改造更為徹底。

云原生數(shù)據(jù)庫(kù)的特點(diǎn):

a. 存算分離,計(jì)算層解析SQL,并轉(zhuǎn)為物理執(zhí)行計(jì)劃,存儲(chǔ)層負(fù)責(zé)數(shù)據(jù)緩存與事務(wù)處理;資源解耦與池化,目前進(jìn)展是CPU和內(nèi)存綁在一起,和SSD持久化存儲(chǔ)分開(kāi)。下一步隨著非易失性存儲(chǔ)和RDMA技術(shù)的成熟,會(huì)將CPU和內(nèi)存隔離,內(nèi)存再進(jìn)行池化,三層池化有利于客戶按需取用;

b. 執(zhí)行引擎的完全彈性,云原生架構(gòu),下層是分布式共享存儲(chǔ),上層是分布式共享計(jì)算,中間用于計(jì)算存儲(chǔ)解耦,提供彈性能力;

c. 高可用與數(shù)據(jù)一致性,可用性是指集群的部分節(jié)點(diǎn)發(fā)生故障時(shí),系統(tǒng)可以在正常響應(yīng)時(shí)間內(nèi)對(duì)外提供服務(wù);一致性是指更新操作完成后,各個(gè)節(jié)點(diǎn)可以同時(shí)看到數(shù)據(jù)的最新版本,分布式系統(tǒng)存在網(wǎng)絡(luò)分區(qū),需要在一致性和可用性之間做出權(quán)衡;

d. 多租戶與資源隔離,傳統(tǒng)做法是一租戶一數(shù)據(jù)庫(kù)系統(tǒng),或者多租戶共享同一個(gè)數(shù)據(jù)庫(kù)系統(tǒng),運(yùn)維管理復(fù)雜,避免某個(gè)租戶“吃掉”系統(tǒng)資源,云原生場(chǎng)景下,數(shù)據(jù)庫(kù)可以為不同的租戶綁定相應(yīng)的計(jì)算和存儲(chǔ)節(jié)點(diǎn)實(shí)現(xiàn)資源隔離;

e. 智能化運(yùn)維,比如自定義備份策略、自動(dòng)在線升級(jí)修復(fù)BUG,監(jiān)控自定義報(bào)警燈。

以AP為例,OLAP從最早的數(shù)據(jù)庫(kù)一體機(jī),逐漸演變到MPP數(shù)據(jù)庫(kù)和Hadoop數(shù)據(jù)庫(kù),再到云原生架構(gòu)的數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)一體機(jī)價(jià)格非常昂貴,國(guó)產(chǎn)替代有南大通用、人大金倉(cāng)、天璣、云和恩墨等;而MPP數(shù)據(jù)庫(kù)的實(shí)時(shí)性非常強(qiáng),現(xiàn)在主要是Greenplum、Teradata;最后是Hadoop,有星環(huán)、中興、華為等傳統(tǒng)的硬件廠商在搭建Hadoop數(shù)據(jù)倉(cāng)庫(kù);最新一代為云原生,檢具擴(kuò)展、存算分離、彈性擴(kuò)容等特點(diǎn)。

共享存儲(chǔ)架構(gòu):服務(wù)器,有計(jì)算有內(nèi)存,存儲(chǔ)完全共享,集群規(guī)模很小,存儲(chǔ)受限,架構(gòu)也受限;

MPP架構(gòu):存算一體,數(shù)據(jù)存儲(chǔ)容量存在瓶頸,無(wú)法滿足隨業(yè)務(wù)而快速增長(zhǎng)的數(shù)據(jù)量存儲(chǔ)需求;擴(kuò)容涉及數(shù)據(jù)的重分布,產(chǎn)生大量網(wǎng)絡(luò)、內(nèi)存開(kāi)銷,影響業(yè)務(wù)連續(xù)性;多ETL任務(wù)時(shí),會(huì)大量搶占資源,從而影響數(shù)據(jù)分析的效率,導(dǎo)致查詢超時(shí)甚至因?yàn)榧贺?fù)載過(guò)大后整個(gè)集群崩潰不可用。例如,Teradata,軟硬一體,網(wǎng)絡(luò)硬件是專有硬件,比較貴,幾百節(jié)點(diǎn),擴(kuò)容比較復(fù)雜;加一個(gè)節(jié)點(diǎn),要挪過(guò)來(lái)一部分?jǐn)?shù)據(jù),所有數(shù)據(jù)要重新打散排一遍;GP解決軟硬一體,X86服務(wù)器上就可以,用軟件實(shí)現(xiàn)TD用硬件實(shí)現(xiàn)的過(guò)程;

Hadoop:隨著數(shù)據(jù)倉(cāng)庫(kù)在 Hadoop/Hive 體系上搭建和完善,ETL 任務(wù)全部轉(zhuǎn)移至 Hadoop 集群,這個(gè)階段使用 Presto 完成 OLAP 分析。Presto 天然和 Hive 共享元數(shù)據(jù)信息,且共同使用物理數(shù)據(jù)存儲(chǔ),即插即用。大量的對(duì)數(shù)倉(cāng)表的靈活查詢使用 Presto 完成;組件非常復(fù)雜,軟件定義存儲(chǔ),分布式文件系統(tǒng);存儲(chǔ)和計(jì)算還是綁定的,交付非常復(fù)雜,做了一些邊緣場(chǎng)景;

云原生架構(gòu):存算分離、彈性(動(dòng)態(tài)啟停)、無(wú)狀態(tài)的網(wǎng)線和計(jì)算節(jié)點(diǎn),錯(cuò)峰使用,例如Snowflake、偶數(shù)科技。

4.市場(chǎng)需求及價(jià)值

(1)數(shù)據(jù)庫(kù)分類-按應(yīng)用方向

按應(yīng)用方向不同,關(guān)系型數(shù)據(jù)庫(kù)又可分為交易型數(shù)據(jù)庫(kù)(OLTP)和分析型數(shù)據(jù)庫(kù)(OLAP):交易型數(shù)據(jù)庫(kù)主要面對(duì)與企業(yè)業(yè)務(wù)數(shù)據(jù)相關(guān)性強(qiáng)的事務(wù)場(chǎng)景,例如銀行轉(zhuǎn)賬,電子商務(wù)等,涉及高并發(fā)數(shù)據(jù)的“增、刪、改、查”;分析型數(shù)據(jù)庫(kù)對(duì)來(lái)自交易型數(shù)據(jù)庫(kù)和其他數(shù)據(jù)源的歷史數(shù)據(jù)進(jìn)行大批查詢,應(yīng)用在海量、復(fù)雜數(shù)據(jù)環(huán)境下為企業(yè)決策提供數(shù)據(jù)分析。

(2)數(shù)據(jù)庫(kù)分類-按數(shù)據(jù)組織形式

按照數(shù)據(jù)組織形式,數(shù)據(jù)庫(kù)可以分為關(guān)系型和非關(guān)系型(NoSQL)數(shù)據(jù)庫(kù)。

關(guān)系型數(shù)據(jù)庫(kù)的核心是數(shù)據(jù)表(行、列數(shù)據(jù))、表內(nèi)結(jié)構(gòu)和表間關(guān)系。非關(guān)系型是一種新型的數(shù)據(jù)結(jié)構(gòu)化存儲(chǔ)方法的集合,適用于各種非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),能夠很好地滿足海量數(shù)據(jù)的高并發(fā)讀寫(xiě)需求。典型的NoSQL數(shù)據(jù)庫(kù)包括鍵值數(shù)據(jù)庫(kù),列存儲(chǔ)數(shù)據(jù)庫(kù)、文檔型數(shù)據(jù)庫(kù)、圖數(shù)據(jù)庫(kù),其中,根據(jù)DB-engines排名,以圖數(shù)據(jù)庫(kù)受歡迎度最高。

部分非關(guān)系型模型示意圖:

圖數(shù)據(jù)庫(kù)

圖數(shù)據(jù)庫(kù)(GDB-Graph Database),是一個(gè)使用圖結(jié)構(gòu)進(jìn)行語(yǔ)義查詢的數(shù)據(jù)庫(kù),它使用節(jié)點(diǎn)、邊和屬性來(lái)表示和存儲(chǔ)數(shù)據(jù)。 目前主流的圖數(shù)據(jù)庫(kù)選擇的圖模型是屬性圖。屬性圖由點(diǎn)、邊、標(biāo)簽和屬性組成。

關(guān)于圖數(shù)據(jù)庫(kù)的實(shí)例:

圖數(shù)據(jù)庫(kù)直觀表示關(guān)系,對(duì)于高度互聯(lián)數(shù)據(jù)非常有用(數(shù)據(jù)量越大,越復(fù)雜的關(guān)聯(lián),優(yōu)勢(shì)明顯)。

應(yīng)用場(chǎng)景來(lái)看,圖數(shù)據(jù)庫(kù)還是針對(duì)用大量數(shù)據(jù)并且需要多維處理或者多層滲透的環(huán)節(jié),因此金融、電商、社交等領(lǐng)域中使用比較多,且場(chǎng)景的針對(duì)性較強(qiáng)。

社交領(lǐng)域:Facebook, Twitter,linkedin用它來(lái)管理社交關(guān)系,實(shí)現(xiàn)好友推薦;

零售領(lǐng)域:eBay,沃爾瑪使用它實(shí)現(xiàn)商品實(shí)時(shí)推薦,給買家更好的購(gòu)物體驗(yàn);

金融領(lǐng)域:摩根大通,花旗和瑞銀等銀行在用圖數(shù)據(jù)庫(kù)做風(fēng)控處理;

汽車制造領(lǐng)域:沃爾沃,戴姆勒和豐田等頂級(jí)汽車制造商依靠圖數(shù)據(jù)庫(kù)推動(dòng)創(chuàng)新制造解決方案;

電信領(lǐng)域:Verizon, Orange和AT&T 等電信公司依靠圖數(shù)據(jù)庫(kù)來(lái)管理網(wǎng)絡(luò),控制訪問(wèn)并支持客戶360;

酒店領(lǐng)域:萬(wàn)豪和雅高酒店等頂級(jí)酒店公司依使用圖數(shù)據(jù)庫(kù)來(lái)管理復(fù)雜且快速變化的庫(kù)存。

圖數(shù)據(jù)庫(kù)一大想象空間來(lái)源于與AI的結(jié)合。圖數(shù)據(jù)庫(kù)的數(shù)據(jù)存儲(chǔ)模型其實(shí)特別適合機(jī)器學(xué)習(xí)計(jì)算,因此,不少人會(huì)直接選擇直接在圖數(shù)據(jù)庫(kù)上跑機(jī)器學(xué)習(xí)算法。近年來(lái),隨著深度學(xué)習(xí)的興起,有了在圖數(shù)據(jù)庫(kù)上做圖神經(jīng)網(wǎng)絡(luò)(GNN)的案例。

 
(文/ofweek)
 
反對(duì) 0 舉報(bào) 0 收藏 0 打賞 0 評(píng)論 0
0相關(guān)評(píng)論
免責(zé)聲明
本文為ofweek原創(chuàng)作品,作者: ofweek。歡迎轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)注明原文出處:http://www.uwf831.com/news/show-1727.html 。本文僅代表作者個(gè)人觀點(diǎn),本站未對(duì)其內(nèi)容進(jìn)行核實(shí),請(qǐng)讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,作者需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問(wèn)題,請(qǐng)及時(shí)聯(lián)系我們3101218373@qq.com。
 

(c)2008-2020 HUATAILIANHE.CN SYSTEM All Rights Reserved

豫B2-20160018-3