您當前的位置:首頁 > 解決方案 > 大數據方案

晶奇 Hadoop 軟件包產品 (version 2008116)說明

時間:2016-10-06 16:16:25    作者: jqsoft   瀏覽:

(初始發布時間2008年12月,更新時間2016年10月)

晶奇Hadoop軟件包(簡稱JQH)是國際一流水平的一站式大數據平臺,大數據分析準確率,計算時間,安全性均經過Apache評估和測試。擁有美國專利保護的面向圖分析,流數據,實時數據等九項大數據分析技術。其主要大數據分析算法2014年被美國工程院列為全球排名前20的前瞻性算法[1]。 對于硬盤數據是一般Hadoop平臺性能的10倍,對于內存數據是一般Hadoop平臺性能的100倍。其主要核心技術,在數據安全技術,網絡安全技術,應用安全技術的基礎上,實現內存硬盤計算、高效檢索、高效實時查詢,高效知識發現。

成功案例包括2008年澳大利亞最大石油勘探開發公司BHP Billionton,2013年澳大利亞昆士蘭州最大公立醫院皇家布里斯本醫院手術室實時分析系統, 2016年中國寧波第一人民醫院。2008年至今,在中國大陸落地的大中小案例在50個以上。

產品的性能特點主要包括以下幾個方面:
(1) 軟件安全性
從物理層和惡意用戶意圖層兩個層面對客戶數據應用網絡進行加密。充分實現數據安全,應用安全,網絡安全。

(2) 算法時效性
能夠保證最快延遲0.02秒內完成同步,同時同步后的數據能夠立即進行實時分析,實時分析速度在硬件性能合理的情況下最快0.03秒內完成計算。

(3) 與數據采集硬件兼容性
-支持通用無線傳感網絡通信協議接口如COM3, ZigBee等,實現實時采集,實時計算。
-支持通用視頻,音頻接口如RLS等。實現實時采集,實時計算。
-支持通用爬蟲軟件。實現對網絡日志的實時采集,實時計算。

(4) 擴展性
支持通過虛擬化、云或集群等方式擴展處理能力;
支持靈活的訪問控制和權限管理,如對數據庫、表、行、列等的管理權限。
支持多租戶管理,支持資源彈性共享和隔離性。

(5) 提升算法可視化
- 支持地理信息系統。
- 支持GPS相關可視化。
- 支持海量優化可視化。

(6) 支持語言及API開發包括
基于平臺進行應用開發所采用的開發語言為主流開發語言。支持WebService、JDBC、REST等常用的接口。支持SQL2003及以上, Python, Matlab, C,C++, C sharp, Virtual C, 兼容Oracle, 支持 Oracle PL/SQL存儲過程, 兼容DB2, 支持 DB2 SQLPL, Delphi, Java, Spark, R 語言, SPSS, Hanan HP, PHP。

(7) 支持操作包括
任何Join, Insert, Update, delete, merge into,分布式事務, OLAP。

(8) 優化指標
支持基于資源優化,支持基于算法優化,支持基于規則優化,支持基于成本優化。

(9) 軟件現實性
實現SQL與Oracle之間互訪,實現SQL與DB2之間互訪,SQL與MySQL之間互訪。

(10) 硬件優化
實現內存或SSD硬件加速。
實現利用內容或SSD的物理特性,進行存儲層結構設計優化。

(11) 可視化實現
實現OLAP Cube模型,支持建立物化Cube,根據事先定義的字段秒級聚合分析。
實現按任意字段秒級別靈活聚合分析,不需要預先創建物化Cube。

(12) 常規API實現
支持API提供第三方使用。

(13) 支持數據字典

(14) 查詢
實現關鍵詞搜索。
實現自然語言查詢。
實現垂直語義查詢。
對PB級海量數據,利用Skyline技術實現精準查詢,最快在0.02秒以內實現。
實現對任意字段組合查詢綜合搜索

(15) 擴展性
從KB級到PB級數據均有很好的擴展性。對PB以上級數據,算法復雜性保持在線性遞增。支持增量算法,梗概算法,在保持一定準確性的基礎上,可將算法復雜性降為線性以下。即支持從小到大,也支持從大到小。支持對大量小文件的自動合并,支持對小文件的高效計算。

(16) 數據挖掘組件算法支持
包括九項美國專利支持的算法:-支持向量遞歸算法,模糊關聯分析算法,面向流數據的動態博弈論算法,支持圖分析的深度學習算法,支持面向大型網絡圖的PCA算法,支持網絡日志數據的推薦算法,支持金融大數據的異常檢測算法,支持銷售數據分析的數學規劃算法,支持普通宏微觀經濟的矩陣算法,一般均衡算法,會計核算算法,支持通用統計算法。
通用分類聚類算法包括
- 支持向量機
- 分布式apiori/fp-growth算法
- 分布式k-means/層次聚類算法
- 分布式svm算法
- 分布式神經網絡算法
- 回歸算法
- 分布式隨機森林算法
- 分布式協同過濾算法
- 時間序列算法
- 分布式決策樹
- 分布式樸素貝葉斯算法
- 分布式梯度提升樹

軟件的功能特點主要包括以下幾個方面:
(1)開放性 
平臺開放性。
對接接口開放性。

(2)兼容性
兼容主流的Linux操作系統。
兼容通用服務器。

(3)性能
統計分析。平均每個CPU core至少每秒1000萬記錄的掃描速度,至少每秒100萬記錄的聚合速度。
高并發查詢能力。按關鍵字檢索單表記錄延時小于200ms,單個節點并發度超過1000;按關鍵字檢索多表關聯記錄延時小于1s, 單個節點并發度超過1000;多表關聯檢索并匯總統計延時小于1s, 單個節點并發度超過100。
流處理能力。萬兆網絡下,單節點不低于200MB/s的處理吞吐能力,簡單業務處理延時毫秒級。

(4)高可用性
平臺可靠性。
故障處理。
異地備份。支持分布式數據庫表異地遠程復制,支持雙向復制,實現異地災備。

(5)安全性管理
完整多租戶策略支持。
Hive權限控制。
HBase權限控制。支持完整的數據權限管控,支持單元格級別的訪問權限控制。
數據挖掘權限控制
流權限控制

(6)運維管理易用性
運維監控。
自定義告警。

(7)平臺在線擴容開發易用性
大數據平臺軟件支持便捷的圖形化開發調試輔助工具。
方便的進行數據探索與數據挖掘建模。
支持分布式數據倉庫,NoSQL數據庫,綜合搜索,數據分析和挖掘以及流處理能力。 

1. Jing He, Xiaohui Liu, Guangyan Huang, Michael Blumenstein, Clement Leung, Current and Future Use of Big Data In Commonwealth Countries, Vol. 44, Number 4, Winter 2014, Pages: 38-45, The Bridge- National Academy of Engineering of the National Academies, U. S. A. 


上一篇:Welcome to JingQi Hadoop®!

下一篇:返回列表

贵州十一选五走势图前三