這篇文章給大家分享的是有關(guān)CDSW1.6的新功能是什么的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
成都創(chuàng)新互聯(lián)公司成都企業(yè)網(wǎng)站建設服務,提供網(wǎng)站設計、網(wǎng)站制作網(wǎng)站開發(fā),網(wǎng)站定制,建網(wǎng)站,網(wǎng)站搭建,網(wǎng)站設計,成都響應式網(wǎng)站建設,網(wǎng)頁設計師打造企業(yè)風格網(wǎng)站,提供周到的售前咨詢和貼心的售后服務。歡迎咨詢做網(wǎng)站需要多少錢:028-86922220
1.Bring Your Own Editor
你現(xiàn)在可以利用CDSW的所有好處,同時使用你熟悉的編輯器。這個功能支持在你本地電腦上運行第三方的IDE比如PyCharm,或者基于瀏覽器的IDE像Juypter。Base Image v8預打包了Juypter,你可以在Start Session菜單中選擇它。
2.Multiple Cloudera Data Science Workbench Deployments
你現(xiàn)在可以通過一個Cloudera Manager部署多個CDSW。
3.Audits
CDSW會記錄特定的事件,比如用戶登錄和分享,你可以通過查詢數(shù)據(jù)庫而查看這些事件。
4.Expanded Support for Distributed Machine Learning
CDSW1.6(或更高)允許你使用TensorFlowOnSpark, H2O, XGBoost等這種框架,運行分布式工作負載。這跟你在HDP/CDH集群中已經(jīng)實現(xiàn)的Spark工作負載是一樣的。
5.cdswctl CLI Client
cdwctl客戶端提供一種額外的方法來與CDSW進行交互,以執(zhí)行某些操作。例如,你可以使用cdswctl客戶端在你本地電腦上啟動一個SSH端點,然后將一個本地的IDE,比如PyCharm連接到CDSW。
你可以在CDSW的Web UI上下載cdswctl,然后在你的本地電腦中使用它。注意這個客戶端不像cdsw命令行工具比如cdsw status。
6.Status and Validate Commands
Cloudera Manager中的CDSW服務現(xiàn)在包含兩個新命令,可以用來顯示CDSW的部署狀態(tài):Status和Validate。在Cloudera Manager中看到的CDSW服務狀態(tài),與你在命令行執(zhí)行cdsw status和cdsw validate命令等價。
7.Experiments
如果你的集群配備了GPU,現(xiàn)在你可以在experiment中使用GPU對模型進行訓練。
跟蹤實驗文件現(xiàn)在會刷新并自動出現(xiàn)在Overview頁面,用于運行一個實驗。以前,當一個實驗結(jié)束后,你需要手動刷新頁面。
8.Command Line Interface (CLI) Changes - RPM Deployments only
刪掉了cdsw reset命令,取而代之的是cdsw stop。
刪掉了cdsw init命令,取而代之的是cdsw start。
9.Kubernetes and Weave
Kubernetes升級到1.11.7版本,Weave Net升級到2.5.1版本。
10.Logs
Staging Directory
你現(xiàn)在可以配置一個臨時目錄,用于保存當CDSW搜集診斷包時的階段日志。當收集一個新的診斷包時,或者當日志大小大于10 MB時,將刪除目錄中的舊日志。
Logs tab
運行的的會話現(xiàn)在會顯示一個Logs選項卡,這個選項卡會顯示engine的日志,如果存在也會顯示Spark的日志。之前,如果你想訪問這些日志,你需要登錄到CDSW主機和Spark服務器上才查看這兩部分日志。
11.Operating System
CDSW1.6支持RHEL和CentOS7.6
12.Workload Scheduling Changes
從1.6版本開始,CDSW允許你指定一個被標記為Auxiliary Nodes的CDSW gateway主機列表。這些主機將在工作負載調(diào)度期間被剝奪。也就是說,他們將被選中來運行不能在任何其他主機上調(diào)度的工作負載。例如,使用非常大的資源請求的會話,或者當其他主機被充分利用時。
Reserve Master Host
CDSW1.4.3引入了一個新的特性,允許在CDSW Master主機上只運行內(nèi)部的應用程序,即不會作為Worker節(jié)點。從1.6版本開始,如果是基于CSD的部署,在CM中可以直接配置Reserve Master Host屬性,而不需要在Safety valves中進行配置。
13.Security
FreeIPA Support
除了MIT Kerberos和Active Directory,CDSW現(xiàn)在也支持FreeIPA作為身份管理系統(tǒng)。
New User Role - Operator
1.6版本包括一個新的訪問角色稱為Operator。當一個用戶被分配為一個項目的Operator角色,他就可以啟動和停止已有的作業(yè),并且可以訪問項目代碼,數(shù)據(jù)和結(jié)果,但只有查看權(quán)限。
Restricting User-Controlled Kubernetes Pods
CDSW1.6包括三個新屬性,允許你控制授予用戶控制(user-controlled)的Kubernetes pod的權(quán)限。一個用戶控制的pod的例子是引擎pod,它為會話、作業(yè)等提供了環(huán)境。這些pod在每個用戶的Kubernetes名稱空間中啟動。由于這些用戶有能力啟動任意的pod,這些設置主要是為了限制這些pod可以做什么。
LDAP/SAML Configuration Changes
之前,如果你想將site administrator角色授予給LDAP/SAML組的用戶,則該組必須在2個屬性下被列出:LDAP/SAML Full Administrator Groups和LDAP/SAML User Groups。如果一個組只是在LDAP/SAML Full Administrator Groups下被列出,而在LDAP/SAML User Groups下則沒有,這個組的用戶將不能登錄到CDSW。
在1.6版本中,你不需要在這2個屬性下列出admin組,在LDAP/SAML Full Administrator Groups中列出的用戶能夠登錄CDSW,并且擁有site administrator權(quán)限,并按預期訪問CDSW。
Project and Team Creation
Site administrators可以在Settings頁面上限制用戶創(chuàng)建項目或team,通過以下2個屬性:
Allow users to create projects
Allow users to create teams
Session Tokens
CDSW Web UI會話令牌的存儲方法已得到加強。升級到版本1.6.0后,用戶必須注銷Cloudera Data Science Workbench Web UI,然后重新登錄。
Sharing
Site administrator現(xiàn)在可以控制是否共享控制臺,通過設置Admin > Security頁面的Allow console output sharing屬性。禁用此屬性可從項目工作區(qū)和workbench UI中刪除Share按鈕,并禁用對整個部署中所有共享控制臺輸出的訪問。請注意,重新啟用此屬性不會自動將訪問權(quán)限授予以前共享的控制臺。您將需要再次手動共享每個控制臺。
TLS/SSL
CDSW現(xiàn)在默認使用TLS1.2。默認的cipher suites也升級到了Mozilla的Modern cipher suites。
14.Spark UI
現(xiàn)在,在使用Spark的運行會話中,Spark UI是其中一個選項卡,你可以直接點擊查看Spark UI。
1.1 引擎升級
CDSW1.6開始打包的基礎engine鏡像包括的R和Python的版本為(version 8):
R - 3.5.1
Python - 2.7.11, 3.6.1
Engine 8中預安裝的軟件包- 參考:
https://docs.cloudera.com/documentation/data-science-workbench/1-6-x/topics/cdsw_engines_packaging.html#engine_8
(僅用于升級)將現(xiàn)有項目升級到最新的Base Engine Images
Base Image v8修復了很多bug,確保對現(xiàn)有項目進行測試并升級到Base Image v8 (Project Settings > Engine),這樣做有以下兩個原因:
Container Security
安全最佳實踐表明引擎容器不應以root用戶身份運行。引擎(v7和更低版本)短暫地以root用戶身份初始化,然后以cdsw用戶身份運行?,F(xiàn)在,引擎v8(及更高版本)遵循最佳做法,并且僅以cdsw用戶身份運行。
CDH 6 Compatibility
你使用的base engine image必須與正在運行的CDH版本兼容。如果你在Spark上運行工作負載,這尤其重要。較舊的base engine(v6和更低版本)不能支持最新版本的CDH6。如果要在CDH 6上運行Spark工作負載,則必須將項目升級到base engine v7(或更高版本)。
CDSW1.6不再支持SLES12 SP2,SP3
因為SLES12 SP2和SP3,SUSE也將停止支持,所有CDSW1.6或以后的版本將不再支持SLES12 SP2和SP3。
GPU設置更改
不再支持nvidia-docker1
NVIDIA Library Path屬性不再可用。
CDSW1.6默認打包安裝nvidia-docker2,啟用GPU后,也會自動設置NVIDIA庫卷的路徑。
CDSW_PUBLIC_PORT環(huán)境變量已被棄用,并將在以后的版本中刪除。改用CDSW_APP_PORT或CDSW_READONLY_PORT環(huán)境變量
1.修復了如果列太多,則必須包含pd.options.display.html.table_schema = True才能顯示Pandas Dataframe的水平滾動條的問題?,F(xiàn)在你不需要額外設置該屬性。
Cloudera Issue: DSE-3562
2.修復了內(nèi)置Workbench編輯器無法正確識別使用制表符(tab)而不是空格的導入代碼的問題。這也解決了在使用制表符(tab)導入代碼時在編輯器中發(fā)生的導航問題。
Cloudera Issue: DSE-2976, DSE-3221
3.修復了如果附件超過4 MB,帶有由作業(yè)觸發(fā)的包含附件的Email無法發(fā)送的問題。
Cloudera Issue: DSE-5980, DSE-6003
4.修復了在內(nèi)置Workbench編輯器中運行大型R腳本時hang住的問題。
Cloudera Issue: DSE-2817
5.修復了Markdown中未呈現(xiàn).md文件的問題。 以前,只有README.md可以正確呈現(xiàn)。
Cloudera Issue: DSE-3315
6.修復了Python模板項目中的模型訓練腳本predict.py的問題。
Cloudera Issue: DSE-5314
7.修復了當生成CDSW診斷包時占用/var/log/cdsw目錄太多空間的問題,現(xiàn)在生成的診斷包大小已減小,現(xiàn)在你也可以配置診斷包生成后的臨時保存目錄。
Cloudera Issue: DSE-5921
8.在模型和實驗中運行的cdsw-build.sh腳本,是以cdsw用戶執(zhí)行的。
Cloudera Issue: DSE-4340
9.解決了當機器重啟后,CDSW無法自動檢測GPU的問題。
Cloudera Issue: DSE-2847
10.修復了由于版本1.4.x中添加的新HTTP安全header而無法在工作臺中呈現(xiàn)iFrame可視化效果的問題。
Cloudera Issue: DSE-5274
感謝各位的閱讀!關(guān)于“CDSW1.6的新功能是什么”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
當前名稱:CDSW1.6的新功能是什么
路徑分享:http://jinyejixie.com/article8/gdpcip.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設計公司、網(wǎng)站收錄、定制網(wǎng)站、網(wǎng)站內(nèi)鏈、外貿(mào)網(wǎng)站建設、小程序開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)