:::

數位趨勢下的開源文化─開源系統應用與人才發展


未來在全球數位趨勢下,企業內部的數位架構將是更為多元的軟硬體系統交錯布建,硬體方面包括各種類的PC、伺服器、中大型工作站以及嵌入式設備等。此外,在這些硬體系統上,依賴不同網路結構的作業系統和各式各樣的套裝軟體也同時運作著。然而,因應工作需求與其情境條件限制,使用者往往需要在這些異質平台上協同完成工作,此時,用戶環境的複雜性、多樣性與多變性,往往會產生跨平台溝通與系統規格支援等相容性問題,也因此導致了開源系統技術在數位時代下的利基。

開源(Open Source)是一種文化,由來已久,開放文化的概念源自開放原始碼運動,伴隨著數位趨勢的巨大進展而日益千里,其背後隱涵的意義在於數位世代下公開透明、共創共享的基本理念,例如軟體工程師界中成形已久GitHub社群,正透過分享程式碼的過程激發資訊領域的創新,不僅在軟體領域,開源硬體的發展亦同步跟進,例如開放式主機板Raspberry Pi,除了躍升為全球十大科技產品外,亦是全球應用在電腦資訊教育的重要教材,此外,舉凡雲端網站、大數據分散式架構、物聯網平台、人工智慧分析框架甚至是當前火熱的5G無線網路通訊等,無不見開源技術應用的相關產品或服務。由此可見,多種朝向開放系統發展的軟硬體因為全球各地人們貢獻智慧結晶而生生不息。現今數位應用領域中,大致可區分雲端平台、大數據、人工智慧與物聯網等四大應用面向。

  1. 雲端平台:雲端運算與相關技術至今發展相對成熟,企業為降低建置成本與未來擴充性,而選擇開放源碼打造雲端平台是常見的情境,而較知名的方案則是在Linux環境下運作的雲端作業環境『OpenStack』,該平台主要2007年是由美國太空總署(NASA)及Rackspace公司所推出,屬於基礎設施即服務(IaaS)的服務型態,不僅具有共同的API介面,亦提供不同功能的服務套件,其它知名的開源雲端平台還有cloudstack、kubernetes等各有其特色而擁有不少使用者,目前已被實際運用在企業的私有雲、公有雲或是混和雲架構。
  2. 大數據:大數據具備資料量大(Volume)、多樣化(Variety)、快速(Velocity)、真實性高(Veracity)等4V特徵,因此開源取向的大數據架構須具備資料擷取、分散式資料庫、即時/離線運算、分散式協調、資料同步、機器學習等不同功能,而Apache Hadoop 是資料導向型公司常用在儲存和計算的基礎開源架構,主要架構由四個部份組成,分散式檔案系統 (Hadoop Distributed File System, HDFS)、資源管理平台(Yet Another Resource Negotiator, YARN)、分散平行演算(MapReduce)以及其他 Hadoop模組使用與共享的程式庫(Hadoop Common),並可相容於其它大數據框架,例如提供大數據查詢和分析的Apache Hive、分散性運算效能更高的Apache Spark運算框架等。
  3. 人工智慧:人工智慧目前以機器學習(Machine Learning)下的類神經網路(Neural Network)所發展的深度學習(Deep Learning)為主流,其本質為高階演算法,因此其開源系統應用目的主要為建構模型與估算參數。目前較為知名的人工智慧開源框架為Google Brain Team研究人員和工程師所開發的TensorFlow,所提供的多種應用程式介面可用於數據的管理、模型訓練與結果推論等。除了TensorFlow,其他人工智慧開源系統包括IBM創建的SystemML、加州大學伯克萊分校人工智慧研究團隊(Berkeley Artificial Intelligence Research, BAIR)和社區貢獻者所開發的Caffe、Facebook人工智慧研究小組開發的PyTorch開源框架等,皆各具特色且受到全球人工智慧社群開發者的青睞。
  4. 物聯網:物聯網簡易來說是可上網設備之間共享數據而形成的網路,主要可分為感測層、網路層與應用層等三層運作架構,執行環境中各類感測器的資料擷取、通訊協定、資料處理與(邊緣)分析,以及透過裝置連線中央平台,進行整合性分析與決策管理,其技術內涵包括上述雲端平台、大數據甚至是人工智慧範疇而相對複雜,因此選擇開源作業系統(open source operating system)會是較佳的解決方案,除了可減少開發成本也能突破設備規格限制,亦可提高相互操作性和可移植性,同時也可促進開源夥伴的參與。目前市場上常見的物聯網開源作業系統包括: Ubuntu Core、RIOT、FreeRTOS、Andorid Things等。

此外,值得一提的是物聯網未來發展中不可或缺的前瞻通訊,近來針對5G通信架構的無線接取技術亦發展出O-Ran (Open Radio Access Network)開放架構,國際開放網路架構組織O-RAN聯盟提出四個目標,包括:介面開放化、軟體開源化、硬體白盒化與網路智慧化。然而,當前面臨的主要挑戰為:與標準保持同步、延遲與可擴展性問題、無線接取網路開源軟體不足、缺乏可靠/可布建及完整文件的軟體與缺乏安全的開源軟體等。

由上可知,開源軟硬體發展已開枝散葉在各領域當中,且未來發展勢不可擋,從近年各單位所開辦的相關課程數量與企業職缺需求來看,亦有顯著成長,故產業開源相關人才的發展不可忽略,除了建立軟硬體開發人員自由開源的基本價值觀外,相關知識技術的科目培育、產業領域的應用能力培訓、職能基準(Occupational Competency Standard, OCS)建置與鑑定等相關人才措施更應逐步到位。以相關知識技術培訓為例,儘管開源系統應用發展的領域有所不同,但共通跨域課題仍可歸納而得,包括開放系統理論、版本管控(Git)與開放系統資安等,簡要說明如下。

  1. 開放系統理論:廣義而言,開放系統係指能與外界環境存在物質、能量、資訊交換的系統,其應用的範疇可擴及各領域,就數位產業而言,主要的應用範疇包括開放源碼、開放硬體以及開放資料,由於開源系統本質上仍不脫離資訊工程領域,進一步聚焦探討則與系統分析與設計主題密不可分。除此之外,對於開放系統工程師(Open-System Engineer)而言,開源協定的拿捏以及Open Source 的整合工程是額外需要注意的部分,因此開源授權條款與系統整合可列於共通跨域的重點課題。
  2. 版本管控(Git):正由於開源架構的公開與彈性,導致其系統版本更新的頻率較封閉系統高,因此從系統管理的角度來看,開源軟體的版本管控肯定是重要的議題。有鑑於此,全球最大規模的開源專案平臺GitHub應運而生,而版本管控(Git)的內涵包括分散式版本控制系統的運作原理、環境設定、Git指令與工作流程(分支、合併與提交)等,皆可設定為開源系統應用人才所需的共同知識與技能。
  3. 開放系統資安:資訊安全無異是近年數位經濟最重要的共同主題之一, 「開源」軟體(Open source software, OSS)不見得就比較不安全,更可能因為程式碼公開,而且有全球開發人員的協助,有時漏洞會更快地被發現,而更快的被修正,2020年8月3日,「開放原始碼安全基金會」(Open Source Security Foundation, OpenSSF)正式成立,主要任務包含漏洞揭露、運用安全工具、識別開放原始碼專案中的安全威脅、安全實踐、保護重要專案、數位身分確認等,可見資安議題在開源系統應用當中的重要性。

聚集國際開放原始碼開發者、使用者和推廣者的COSCUP開源人年會(Conference for Open Source Coders, Users and Promoters!)至今已邁向第16年,金(2021)年7/31~8/1於臺灣科技大學舉辦,此活動宣告了臺灣開源人才的活力與開源運動的進行式。除此之外,臺灣在地的開源社群亦遍地開花,根據電子報iThome報導,臺灣企業和開發者對GitHub的運用越來越深,2019年,根據GitHub統計,臺灣開源開發者的人數成長了34%,是GitHub全球排名第8高的地區。無獨有偶,政府部門,包括教育部、經濟部與中研院等各單位以及法人組織(如工研院、資策會等)也已陸續提出各種有關Open Source的推廣計畫與機制,冀望國內產業能在Open Source上能得到更好的發展。上述如此的萬事具備,足以彰顯臺灣在數位趨勢下的開源文化已自成氣候,或許仍欠缺的些許「東風」正是各產業中開源系統應用人才的系統化發展與培養。

作者:歐宗霖/工研院產業學院研究員