實現于圖形處理器之高效能平行多字符串比對算法
發布日期:2018-05-22
時間:5月22日9:30
地點:學術報告廳
主講人:林政宏
主講人簡介:
林政宏(Cheng-Hung Lin)博士為臺灣新竹清華大學資訊工程博士,現任臺灣師范大學電機工程系副教授。目前的研究興趣包括并行計算,圖形處理器程序設計,機器學習和物聯網。他的數篇論文獲得高等級期刊IEEE Transactions on Computers (TC)、IEEE Transactions on Parallel and Distributed Systems (TPDS)、IEEE Transactions on Very Large Scale Integration (VLSI) Systems接受刊登。林政宏博士致力于開源軟件的開發,他所開發的一個開源庫,名為「PFAC」為目前全世界最快速的多字符串比對算法之一,公開于Google Code 與GitHub,獲得許多研究者的引用與下載使用。此外,他於2017獲得本院教學杰出獎,近年來并主持多項國際產學計劃,與產業界合作密切。
發表論文:
1.Cheng-Hung Lin et al., "Accelerating Pattern Matching Using a Novel Parallel Algorithm on GPUs," in IEEE Transactions on Computers, Vol. 62, No. 10, pp. 1906-1916, 2013.
2.Cheng-Hung Lin et al., "Perfect Hashing Based Parallel Algorithms for Multiple String Matching on Graphic Processing Units, " in IEEE Transactions on Parallel and Distributed Systems (TPDS), Volume: 28, No. 9, Sept. 1, pp.2639 - 2650, 2017.
3.PFAC library, https://github.com/pfac-lib/PFAC
講座內容概要:
多字符串比對(Multiple string matching)算法主要應用于網絡入侵檢測系統(Network Intrusion Detection System,NIDS) ,用來比對網絡封包是否含有攻擊病毒的字符串特征,其中以Aho-Corasick algorithm最被廣泛使用。為改善網絡入侵檢測系統的效能以滿足網絡帶寬的要求,改善多字符串比對算法的效能成為最重要的課題。報告人在過去的研究中,提出一個高效能的并行算法,稱為Parallel Failureless Aho-Corasick (PFAC)算法,并實現于圖形處理器上,效能上獲得非常巨大的改善,此項成果于2013發表于IEEE Transactions on Computers期刊上。之后鑒于攻擊病毒的字符串特征持續增加會導致內存需求大量增加,這對實現GPU是很大的挑戰,因此為減輕該算法的內存需求,以更能適用于GPU上,報告人進一步提出使用完美哈希(Perfect hashing)來壓縮內存,減少超過99%以上的內存需求,對于內存需求得到巨大的改善,此項研究成果于2017發表于IEEE Transactions on Parallel and Distributed Systems上。此外,這兩項算法的研究成果也已開發成函示庫,公開于Github (https://github.com/pfac-lib/PFAC),獲得許多研究者的下載與引用。本次講座將詳細介紹PFAC算法與內存優化技術。