数据科学公司Anaconda进行的一项调查研究显示,大约40%的行业专业人士表示,出于安全方面的顾虑,其所在企业减少了开源软件使用。
Anaconda在4月和5月间调查访问了来自133个国家和地区的3493位行业专业人士,包括学者、行业专家和学生,其中约有16%的受访者是数据科学家。随后,该公司综合分析受访者的意见,发布了《2022年数据科学状况》报告。
大约33%的受访者表示自己并没有减少开源软件使用,7%声称增加了开源软件使用,20%则表示不确定是增是减。剩下40%表示自己已经减少了开源软件使用。
根据行业专业人士(Anaconda所谓的商业受访者)的说法,这一行意味着要博采业务分析师、产品经理、数据和机器学习科学家与工程师、标准IT人员(如系统管理员),以及技术、金融、咨询、医疗保健等其他领域人员的数据科学学习之长。
而报告所谓的“减少”,并不意味着“停止”:87%的商业受访者称其所在企业仍允许使用开源软件。不过,似乎很多受访者在寻求降低依靠太多开源依赖项的风险。
Anaconda的报告发现,Log4j之类的事件和关于“抗议软件”的报告,促使开源软件用户更加重视安全问题。有40%的受访者减少了开源软件使用,其中过半数受访者是在Log4j漏洞频曝之后这么做的。
约31%的受访者称,安全漏洞是开源社区如今面临的最大挑战。
Anaconda表示,大多数企业都使用开源软件。但有8%的受访者表示不使用开源软件,其中超过一半(54%,比去年增加了13%)提到安全风险是其不使用开源软件的原因。
不使用开源软件的其他原因包括:缺少了解(38%);对组织IT治理缺乏信心(29%);“开源软件被认为是不安全的,因此不准用”(28%);不想打乱当前的项目(26%)。
Anaconda的调查还揭示了企业对技术人才短缺的担忧,90%的行业受访者担心人才短缺。约64%的受访者表示,最忧心能否招募和留住人才;56%的受访者则认为,缺乏数据科学人才是企业数据科学工作的主要障碍之一。
在一份声明中,Anaconda运营高级副总裁Jessica Reeves表示:“企业应加强可用于持续学习的工具和资源,学术机构应为学生补足技术短板,使学生在准备进入劳动力市场时具有技术优势。”
Reeves认为,对现有员工进行数据科学培训,以及提供更具吸引力的远程工作选择,有助于招募和保留人才。
Python仍然是数据科学类首选编程语言。31%的受访者称自己“总是”使用Python,27%表示“经常”使用这一编程语言。相较之下,面向科学计算的高性能动态高级程序设计语言Julia,则只有3%的受访者表示“总是”使用,“经常”使用的占比为12%。
仍然缺乏对数据科学伦理的足够关注。调查发现,24%的受访者表示其所在企业缺乏解决算法公平性和偏差的标准、策略或衡量工具。另有15%的受访者不确定所在企业如何应对这些挑战。
学术机构在调查中的表现更差。在学术领域的受访者中,只有19%表示其所在机构教授数据科学和机器学习伦理,20%表示其各自领域的课程都包含了伦理方面的内容。
仅23%的学术受访者和21%的学生表示会定期教授AI/ML/数据科学中的偏差。大约39%的受访者表示很少教授,36%表示从未教授过。Anaconda指出,与公司2021年的调查相比,这一数据至少同比下降了9%。
约三分之一(32%)的受访者称,数据和模型偏差的社会影响是当今AI/ML/数据科学的最大问题所在。
调查报告中写道:“教育领域无疑应更加重视伦理和偏差。”
Anaconda《2022年数据科学状况》报告
https://www.anaconda.com/state-of-data-science-report-2022
文章来源:数世咨询
黑白之道发布、转载的文章中所涉及的技术、思路和工具仅供以安全为目的的学习交流使用,任何人不得将其用于非法用途及盈利等目的,否则后果自行承担!
如侵权请私聊我们删文
END
多一个点在看多一条小鱼干