人工智能扮网络安全配角 机器学习仍难一肩挑网络攻防
在人工智能的时代浪潮下,机器学习作为核心驱动力,对于网络安全领域的发展具有深远影响。亚信网络安全产业技术研究院副院长童宁在C3安全峰会上深入探讨了这一主题。
当我们谈论机器学习在网络安全领域的应用时,两个核心概念常常浮现在我们脑海:“有监督学习”和“无监督学习”。百度安全首席架构师武广柱对此进行了解释:有监督学习,就是人们为机器提供数据的标签,告诉它“哪些数据是属于哪一类的”,然后进行训练;而无监督学习则是不给机器提供任何标签,直接由人们对最终输出的结果进行定义。
尽管人工智能在许多行业中引发了关于“取代”的忧虑,但在网络安全领域,人工智能更多的是作为一个辅助工具的角色存在。童宁强调,至少在可见的未来,还是需要领域专家和网络安全专家来主导这一领域的工作。尽管如此,随着对机器学习技术的深入开发与应用,网络安全正在迈入一个新的阶段。
早在1986年,美国斯坦福研究中心就提出了使用数据统计来检测网络非法入侵,这表明机器学习技术在网络安全领域的应用已经有着悠久的历史。真正让机器学习技术在网络安全领域大放异彩的,是近年来的移动互联网的飞速发展。大量的移动设备产生的日志数据,为机器学习算法的应用提供了丰富的素材。
趋势科技资深数据科学家张佳彦从技术发展和经济原因两个角度分析了机器学习介入网络安全的“充分条件”和“必要条件”。他从数据角度指出,从2006年开始,网络病毒数量急剧增加,使得仅靠人工分析阻挡病毒变得不切实际。这种情况为机器学习的介入提供了充分条件。直到2013年机器学习技术才逐渐被安全专家重视,这其中不仅有技术原因,还有经济考量。随着病毒制造者从单一黑客演变为有组织的黑客犯罪系统,网络安全公司开始使用机器学习技术对抗病毒。但用户对于机器学习的接受度受到误判率的困扰。直到勒索软件的兴起,机器学习的应用变得尤为重要,因为其对立即性损失的预测和防范能力远超其他解决方案。
在网络安全领域,有监督学习和无监督学习扮演着重要角色。有监督学习在恶意程序、垃圾邮件识别和勒索病毒防治等方面表现出强大的能力,特别是在需要多维度识别的情况下,能够大幅提高识别速度和效率。而无监督学习则在网络行为分析、用户画像等方面有着广泛的应用前景。
机器学习正在驱动网络安全领域的发展,虽然目前还面临着一些挑战和困扰,但随着技术的不断进步和应用的深入,其在网络安全领域的应用前景将越来越广阔。在无监督学习的领域里,机器以其独特的方式对海量数据进行分类和聚合,这一过程无需预设的分类标签,完全依赖数据自身的特性。如同一位艺术家在未经指导的情况下,通过直觉和感知创作出新的艺术作品。童宁形象地解释了无监督学习的优势所在,即它能够轻易捕捉到那些被忽视的“少数派”,并帮助人们警觉到那些难以察觉的异常行为。这就像是在茫茫人海中,我们能够迅速定位到那些与众不同的个体。
当我们谈论有监督学习和无监督学习时,无论是哪一种学习方法,背后都离不开持续性的高质量数据。这是因为网络环境在不断变化,机器学习的内容也需要与时俱进。这就像是我们人类一样,需要不断地学习新的知识,以适应这个瞬息万变的世界。童宁以半开玩笑的方式表达了这一观点:“机器跟我们人类一样,需要‘活到老,学到老’,从而保证它的学习能力。”
无论是数据专家还是网络安全专家,单纯的专家团队并不能充分发挥机器学习的潜力。领域专家的参与同样不可或缺。因为只有在他们精准的指引下,机器学习才能更好地抽取和概括特征。就像张佳彦所指出的那样,领域专家的重要性在于他们能够为机器学习产生有效的特征输入,这需要他们的丰富经验以及反复不断的测试。这就像是烹饪一道美食,除了食材和厨师的技巧外,还需要厨师对食材的深入理解才能做出美味的佳肴。
尽管机器学习有着巨大的潜力,但它并非万能灵药。张佳彦将机器学习比作一颗“原”,虽然威力巨大但也存在风险。误判率就像是悬在机器学习头上的一把达摩克利斯之剑。尽管我们可以努力降低误判率,但无法完全消除它的存在。这就需要我们更加谨慎地对待机器学习,特别是在关键领域如垃圾邮件分类和恶意程序查杀等。童宁作为一线安全专家更是深知这一点,他强调我们不能过分依赖机器学习而忽视其他技术手段的综合应用。即使机器学习再强大也只是辅助工具,网络攻防是永恒的主题。我们需要拿出各种武器与黑客战斗到底。这就像是一场没有硝烟的战争,我们需要运用所有的智慧和力量来应对挑战。