:::

歐盟運用大數據分析線上職缺,掌握產業人力需求


看到線上職缺資料的價值

在網路應用普及下,線上求職平台在近10年已成為重要的人才招募及求職工具,原網路徵才興起多以高技能工作職缺為主,至今線上職缺(Online job vacancy)已涵蓋所有類型的職業與技能水準。

歐洲職業訓練發展中心(European Centre for the Development of Vocational Training, Cedefop)見歐盟各國已有許多公私立線上求職平台存在,認知到平台上有豐富、即時的勞動力市場趨勢,能蒐集到新職缺及技能需求,可補強歐盟難以用傳統調查方法可取得的雇主人力需求證據,搭配現有正式勞動力調查。因此,Cedefop自2016年起即在思考如何運用線上職缺資料,以掌握歐盟人力需求變化。

Cedefop基於上述緣由,開發一套可廣泛蒐集及分析歐盟線上職缺的系統,並建置有大數據蒐集分析及機器學習等機制,提高分析速度及效益。目前彙整捷克、德國、愛爾蘭、西班牙、法國、義大利和英國等7國職缺資料,並於2019年3月公布分析報告。未來預計在2020年底在歐盟會員國全面實施,最終連結歐盟的技能/職能、資格認證、職業分類(European Skills, Competences, Qualifications, and Occupations, ESCO)等架構,並與歐盟統計局的大數據團隊及歐洲統計系統(European Statistical System)的ESSnet合作,發揮此系統發揮最大潛力。

 

線上職缺來源及蒐集方式

Cedefop與7個國家共300個公立、民營及國際之線上職缺平台洽談合作,蒐集可在網路上搜尋到的線上工作職缺。並透過以下步驟蒐集線上職缺資料:

  1. 第一步—數據擷取:從300個平台來源,透過應用程式介面(Application Programming Interface, API)、抓取(Crawling)、爬蟲(Scraping)三種方式,下載符合需求的職缺資料,將結構及非結構職缺資訊存到資料庫中。
  2. 第二步—資料前處理:清除非相關資訊。
  3. 第三步—資訊抽取(擷取):將職缺相關資料經設定好的知識本體(ontology,亦可稱為本體論,是大數據分析所需各類知識的基礎架構),透過機器學習方式智慧地讓職缺被分類到適當的類別及階層中,存放到資料庫中。
  4. 第四步—展示結果:運用Tableau視覺化工具,建立各種可自動更新資訊的儀表版(Dashboard),及智慧地完成勞動市場與技能需求分析。

歐洲職業訓練發展中心的線上職缺資料蒐集與處理,分為數據擷取、資料前處理、資訊抽取、展示結果等四大程序。 

圖一、線上職缺資料蒐集與處理程序

資料來源:歐洲職業訓練發展中心(Cedefop)

 

此系統最具智慧化的階段為資料抽取階段,因跨越27個會員國,故先偵測語言類型,再進行一次資料前處理以排除雜訊,透過職缺分類架構做適當的資料分類。其中關鍵為職缺分類架構及怎麼分。

  • 分類架構:以歐盟現存的知識本體為基礎(如職業分類、產業分類、學歷、地理區域等),若有項目無既存分類(如合約類型、工作經驗、薪資、時薪等)則自訂設計。分類架構會持續更新及豐富內容,以反應最新情勢(如職業新趨勢、新標準分類),並以專家方式提高其分類準確性,暫不使用機器學習方法。
  • 分類準則:先將與分類架構匹配一致或相似的資料(如與標準職業分類有關的職缺標題)直接分類,若系統難以辨識分類,再用機器學習決定分類類別,每個變量(例如職業、地區及語言)均要不斷訓練,找到最佳的機器學習模型。

歐洲職業訓練發展中心的線上職缺資料的資訊抽取程序,以歐盟現存的分類架構為基礎,輔以機器學習模型的運作。

圖二、資訊抽取程序

 

線上職缺分析之侷限

線上職缺雖有大量及多元的資訊可供蒐集分析,但仍有一些重大限制影響其分析品質。

  1. 統計數據會有偏差:雇主求才不一定都透過線上平台,可能部分職類會以非線上方式招募。而某些職缺會因雇主希望增加職缺曝光機會,而重複刊登在不同線上職缺平台,並不代表真的有那麼多職缺數。
  2. 技能資訊蒐集有限:雇主刊登線上職缺時,僅會列出關鍵技能與資格條件,以達到過濾求職者之目的,職缺技能需求不會全部顯示在職缺資料上。
  3. 數位落差影響職缺蒐集程度:部分國家因網路滲透率偏低及國民基本數位技能不足,影響線上職缺資料的數量及品質。
  4. 分類架構及數位技術仍有精進的空間:職缺資料需能被機器讀取分析,而現有分類架構及機器學習技術仍需有很大改善空間,需持續在專家協助下改善分類架構,及優化人工智慧技術。

 

可更詳細洞悉職缺特徵,作為各種人才發展措施規劃依據

Cedefop認為可透過線上職缺分析,即時發現哪些職業、產業或地區之職缺成長最多;或哪些新工作類型或技能需求浮現,並可跨職業橫向分析掌握勞動市場趨勢,及不同時間維度下的職缺及其技能變化。

此外,此結果能作為政策制訂者規劃人才發展政策、教育與培訓提供者規劃課程、就業服務和職涯顧問提供青年及待業者指引職涯方式,及國民就業之參考。其分析整理結果展示於Cedefop Skills-OVATE網站。

 

對我國推動人才需求分析之啟發

受惠於大數據及人工智慧相關軟硬體技術,除歐盟開發本文所述之線上職缺分析系統外,日本厚生勞動省也正運用線上職缺及人工智慧,建立其職業情報提供網站(日版O-NET,預計2020年3月上線),建立可即時更新及橫向比較的職業資訊,促進勞工於職業間的流動及能力養成,顯見相關做法有其一定效益及可行性。

我國政府現有勞動市場統計分析做法,多半定期以問卷調查掌握雇主需求,但現今產業變化快速,再加上彙整分析作業,其結果公布時易落後市場變化甚多。此外,調查受限於既有行職業分類架構,不易掌握更詳細的職務及技能需求資訊,各界參酌其成果實質助益有限。應可思考如何運用線上職缺與現有調查做法互補。

建置線上職缺蒐集及分析系統所需軟硬體技術,對我國IT技術人員並非難事,但建置及維運運作機制需一定規模的人力及經費投入,首先需取得許多資料平台單位同意提供資料,並邀集大量各領域專家齊力建立合適分類架構及建立機器學習模型,最後還可連結各層面數據應用端,設計智慧分析報表。但此串連各職缺平台的分析系統一旦建立後,將類似生態圈的概念,可重複讓各界共享使用,並在同一數據分析結果,商議我國人才發展政策及能力養成規劃,甚可再串連我國各種經濟活動或人口變化數據,做出更精確的職缺變化預測,故明顯具有公共共同利益。

基於上述考量,此系統若由政府部會、公司或研究單位分別建立,恐難以發揮其綜效,還會耗損過多建置成本。故可由單一部會(如國家發展委員會、主計總處或勞動部)建立我國整體的線上職缺分析系統,有效發揮我國線上職缺的數據價值,避免穀倉效應的存在,促使我國人才政策能更快速因應產業人力需求變化,對焦產業技能需求。

 

延伸閱讀:

  1. Online job vacancies and skills analysis
  2. The online job vacancy market in the EU
來源:陳明訓/工研院產業學院資深管理師