3/17/2017

Python 人物誌:R-Ladies Taipei Host - Yen

訪問人: Yen  主持/撰稿人: Zonghan 日期:2017/03/06



# 關於 R 與 Python
Zonghan:妳本身是以 R 做分析的,請問是在什麼樣的情況下會選擇使用 Python?妳覺得 R 與 Python 各適合用在什麼地方?
Yen:我本身做的是金融相關的工作,經常會研究到剛發表在 paper 上的統計模型,而 R 是統計學家常用的程式語言,當統計學家發表新的模型時,通常會同時附上 R 的程式碼。同時, R 語言上面各種統計方法的套件非常多,功能也非常完整強大。最方便的是,使用 R 可以直接拿別人發 paper 時寫好的程式碼來用,不用自己刻。相對的,在 Python 的領域,統計相關的套件就沒有這麼多。雖然 Python 在數值計算上面的基礎套件非常強大,但是如果要拿它來做統計研究,就必須自己參考 paper 再重新撰寫一次程式碼,這相對比直接用 R 來做耗工耗時。
不過, Python 的優勢在系統面,我通常拿 Python 來做資料的 ETL ,尤其 Python 有 Pandas 這個套件,資料處理非常的方便。所以我通常會透過 Python 先將資料整理好再用 R 做模型分析。
如果提到最近很夯的機器學習,則 Python 又再度勝出。 Python 的 scikit-learn 是一個很完整的機器學習套件,而且在 deep learning 方面,各家的套件幾乎都支援 Python。因此, Python 在機器學習上應該是比 R 好用的。


# 關於社群
Zonghan:妳本身是社群的 host 也參加過 PyCon APAC 2014 的籌備團隊,請問妳對於經營社群有什麼樣的看法?


Yen:我覺得參加社群給 talk 除了是讓講者有一個表演的舞台之外,也是讓雙方可以互相學習。講者增加經驗與曝光度,聽眾也長知識。最重要的是,大家都是利用剩餘的時間來參加這些 meetups,講者是利用額外的時間來準備投影片,聽眾也是利用下班或者是假日時間來做學習,所以經營與參加這些活動最重要的一點是不要對自己造成太多額外的負擔。不過,籌備像 PyCon APAC 這樣的活動就比較累。我在 PyCon APAC 2014 是擔任註冊組組長,註冊組在接近活動的那一段時間,非常的忙碌,幾乎必須在活動前後請一兩天假才能完整 support 這個 event。


# 關於社群國際化
Zonghan: 妳最近去西班牙馬德里來了一段 meetup travel?可以分享一下經驗?


Yen:我這次是去西班牙馬德里給 talk,雖然是去西班牙,但是並不會有語言不通的問題,因為大家都可以用英文來做溝通。到國外的社群給 talk ,不僅可以增加台灣社群的能見度,也能結交外國的社群朋友。像我這次去馬德里,因為我們 R-Ladies Taipei 社群最近在台灣跟台灣微軟走得比較近,透過這層關係,最後爭取到了西班牙的微軟對馬德里當地 R 社群的贊助,雖然馬德里微軟的總部距離他們 R 社群 meetup 的地方只有幾公里遠,但很妙的是雙方這層緣份卻是透過台灣人牽起來的。這對於增進雙方的關係,有非常大的幫助。當然,除了去社群演講、互相交流之外,當地人會當嚮導帶你去吃當地好吃的東西。根據我這一次的經驗,幾乎都是當地人點得才會好吃,自己看 menu 點的東西通常都很難吃 XD。

# 結論
Zonghan:最後可以請你講一下,對於台灣各地社群的一些建議嘛?

Yen:我覺得台灣的社群需要盡量與國外的社群接觸。台灣有很多人才,但是對國外接觸太少,所以人才發展的空間與發揮的舞台都受限制。 open source 的社群本來就是全球化的,而且,軟體的工作機會也是國際的機會多過於台灣本地的。台灣的在地社群應該多多與外國社群接觸,才能增加自己的能見度,也才能提供台灣的人才更多成長與發揮的空間。

3/09/2017

認識 Keynote Speaker #2 : 林軒田

林軒田(HT Lin)


Bio(簡歷)

林軒田畢業與台大資工系爾後在美國加州理工學院取得碩士與博士學位。博士畢業後返回台大擔任教職並且致力於機器學習領域的研究與教學。研究上他獲得獎項無數像是 2012 ACM Taipei Chapter 「李國鼎青年研究獎」與 2013 年國科會「吳大猷先生紀念獎」。教學上他在台大資工系所開設的 “機器學習基石” 課程一直以來都是搶手課程,所寫的 《Learning From Data》也名列 Amazon 機器學習一類排行榜的前幾名。他所帶領的學生研究團隊也在 2010 至 2013 年,連續獲得了4 年( 6 座)的 KDDCup 世界冠軍。
林軒田除了研究與教學上擁有傑出的貢獻與表現,同時也致力於與產業做結合。因此他現在從台大資工系借調到 Appier 擔任 Chief Data Scientist。Appier 是一間新創公司,致力於讓 AI(人工智慧)使用更為容易。

Title(演講題目)

TBD

Abstract(演講大綱)

TBD

Scikit learn

大數據、機器學習可說是這幾年科技業最火紅的討論主題之一。「數據科學家」(Data Scientist)更被《哈佛商業評論》喻為「21世紀最性感的職業」。在 Python 之中,最著名的機器學習套件就是 Scikit-learn(http://scikit-learn.org/)。緣起於一個在 Google Summer of Code 之下的計畫,後續由法國國家資訊暨自動化研究院主導開發與支援。從開發者的角度來看,Scikit-learn 設計的使用邏輯設計非常簡單。它將繁雜的機器學習過程簡化到幾個步驟完成。一群台灣的開發者們,也針對 Scikit-learn 做了線上學習電子書方便大家學習(https://www.gitbook.com/book/htygithub/machine-learning-python/),同時用開源的方式將書本編輯全放在網路上(https://github.com/htygithub/machine-learning-python) 供大家一起編輯開發。對機器學習有興趣的 Python 愛好者們,快點去一探究竟吧!除此之外,PyConTW 今年請到的 Keynote speaker 之一,便是國內機器學習的大師級研究者,林軒田老師。對機器學習有興趣的Python愛好者們,千萬不要錯過這次的 Keynote 演講喔!除了Keynote 演講之外,林軒田老師最著名的就是在 Coursera 的機器學習線上課程。現在在Youtube 上就可以看得到囉!
課程分為機器學習基石(初階)與機器學習技法(進階),快點去看看吧!

主動學習 active learning 與林軒田老師自己實驗出的 Package

Active Learning - 主動學習

主動學習,是機器學習下的一個種類。是半監督機器學習的一個分支。在這樣的機器學習演算法下,機器會用互動的方式去詢問使用者相關資訊以獲得新的數據點所期望的輸出。簡單來說,機器會主動的問問題。舉例來說,一個做手寫識別的機器,可以主動產生一個數字,比如說是9,它就會問使用者說這個數子是多少,進而得到這個數字的標記是9。以這樣的方式進行下去很多個循環,得到一個模型的方式,就被稱為主動學習。通常會用於得到數據的標註十分昂貴的情況下。這次的 PyConTW,請到的 Keynote speaker 之一,林軒田老師也是主動學習的研究者,最近他們的實驗室也推出一個主動學習的論文及對應的 Python Package並開源在 github快點進去一探究竟吧!

認識 Keynote Speaker #1 : Carol Willing

Carol Willing


Bio(簡歷)

Carol Willing is a Director of the Python Software Foundation, a core developer for Project Jupyter, and a Research Software Engineer at Cal Poly San Luis Obispo.

She's also Geek-In-Residence at Fab Lab San Diego and co-organizes PyLadies San Diego and San Diego Python. She's an active contributor to open source projects, a maintainer for OpenHatch and the Anita Borg Institute's open source projects. Combining a love of nature, the arts, and math with a BSE in Electrical Engineering from Duke and an MS in Management from MIT, she's enjoyed creating and teaching others for over 20 years.

She recently spoke at PyCon US 2016, PyCon Philippines 2016, Write/Speak/Code 2016, SciPy 2016, and PyData Carolinas 2016.

Title(演講題目)

Education, Contributor Onboarding (temporarily)

Abstract(演講大綱)

TBD

Introduction(介紹)

經常總會聽到 Carol Naslund Willing 說:「這真是太酷了。它是如何運作的?好希望學習到更多有關的事物。」 她熱愛開發軟體,目前為 PSF (Python Software Foundation) 基金會理事之一 、 Project Jupyter 的核心開發人員與加州理工大學聖路易斯奧比斯 ( Cal Poly San Luis Obispo) 的軟體研究工程師。她活躍於開源專案的共同開發,並且維護像是 OpenHatch 與 Anita Brog Institute 的開源專案。

與人之間的經驗使我有了這樣感觸:「用你所學,使事情更好,並且與人分享。」Caril Wiilling 這樣說的。


Carol Willing 對學習和分享充滿熱情。最近的演講包括 PyCon US 2016,PyData Carolinas 2016,PyCon Philippines 2016。

Carol Naslund Willing can frequently be heard saying “That’s so cool. How does it work? I would love to learn more about it.”She has enjoyed developing software and is a Director of the Python Software Foundation, a core developer for Project Jupyter, and a Research Software Engineer at Cal Poly San Luis Obispo. She’s an active contributor to open source projects, a maintainer for OpenHatch and the Anita Borg Institute’s open source projects. 

My experiences with people have taught me to “use what you have learned to make something better and share with others”.

Recent lectures include PyCon US 2016, PyData Carolinas 2016, PyCon Philippines 2016.


參考網站




Fab Lab

Fab Lab 是一個公有空間,讓人們能在裡面一起集結,凝聚想法與夢想並付諸實現的地方。關於 Fab Lab 的完整定義可以在 MIT 的 Bits and Atoms 中心找到:http://fab.cba.mit.edu/about/faq/。這次的 keynote speaker 之一,我們邀請到美國聖地牙哥的 Fab Lab 參與者 Carol Willing。作為一個軟體工程師,她熱衷於 Python,是 PSF (Python Software Foundation) 基金會理事之一 。但也同時是 Fab Lab 的愛好者。她也曾專文撰寫過什麼是 Fab lab(https://willingconsulting.com/whats-a-fab-lab/)。快點進去探探究竟吧!

Jupyter Hub

假如您使用過 Python, 應該或多或少聽過或是實際使用過 Jupyter notebook (也就是 IPython notebook 的繼承者),而 JupyterHub (https://github.com/jupyterhub/jupyterhub) 是基於 Jupyter notebook 的延伸,它能讓原本只能操作於單一個人的 Jupyter notebook 擴充到讓多位使用者同時線上操作,而且提供更簡單的方式來管理這些基於單一使用者的 Jupyter notebook 們。應用上,無論是一班學生或是資料科學的團隊,都能以更方便的方式使用建構在伺服器上的 Jupyter notebook。無論是 Jupyter notebook 或者 Jupyter Hub 都是 Project Jupyter (http://jupyter.org/) 的一員,而本次我們邀請的 keynote speaker 之一,Carol Willing,就是 Project Jupyter 的核心開發人員喔!一起到她的 Github (https://github.com/willingc) 來逛逛吧!