《Journal of Dairy Science》:Invited review: Milking the data for value-driven dairy farming
编辑推荐:
这篇受邀综述全面探讨了数据驱动技术如何重塑全球乳业,系统回顾了精准乳业(PDF)在提升生产力、盈利能力和可持续性方面的关键作用。文章深入剖析了人工智能(AI)、机器学习(ML)、传感器技术在乳业的应用,识别了技术采纳的驱动因素与障碍,强调了可持续数据管理、标准化和跨领域(如医疗健康)经验借鉴的重要性,并对构建一个更具韧性、高效和技术驱动的乳业未来提出了前瞻性建议。
为价值驱动型乳业挖掘数据:一场数据驱动的产业变革
精准乳业(Precision Dairy Farming, PDF)正在通过数据驱动技术深刻改变全球乳业格局。它利用自动化挤奶系统(Automated Milking Systems, AMS)、可穿戴设备等技术收集海量数据,实现对奶牛生产、繁殖、健康、福利及环境因素的实时监测,从而优化运营,推动更明智、数据驱动的决策。这场变革的核心,在于如何从数据中“挤出”最大价值。
数据在乳业的经济价值
数据的经济价值体现在提升生产力、产品质量以及改善动物健康与福利等多个维度。调查显示,约68%的美国奶牛场已使用某种形式的精准乳业技术,而爱尔兰约70%的农户结合使用了精度和自动化技术。对生产者而言,数据的真正经济价值在于将其转化为可操作的见解,直接影响牧场盈利能力。例如,活动监测系统的应用通过更高效的发情检测改善了繁殖管理,从而减少管理时间并提高产奶量。使用摄像头持续测量 locomotion 评分,有助于疾病的早期发现。收集详细的个体动物数据为遗传改良开辟了新机会,例如开发甲烷排放的育种值。
AI驱动的洞察,源自传感器和挤奶机器人收集的数据,有助于优化饲喂策略,进而提高产奶量。基于每次挤奶时不断更新的产奶记录进行精料补充的个体化饲喂,对产奶量、饲料效率、繁殖和动物健康具有潜在益处。AI驱动系统还能通过检测传感器测量的行为变化来诊断热应激,从而实现有针对性的干预策略。向PDF转型的另一项关键创新是通过预测性和动态仪表板应用实时分析。这些工具已被证明可以增强农场的决策和资源管理,目标是优化生产和利润。
有效的数据管理和连接还能在牧场之外显著提高效率、盈利能力和消费者透明度。数据不仅用于运营效率或货币收益,还可用于改进面向消费者的数据,例如准确的产品标签和“最佳食用日期”,帮助消费者做出明智决定、减少食物浪费,并通过跟踪和控制加工和零售环境中的库存水平和产品周转来改善库存管理。将数据分析整合到加工运营中,可以利用从数据中学习和适应的动态ML模型以及基于预定模式专注于预测结果的预测算法,实现对未来结果(如保质期和腐败问题)的预测。
随着PDF创新的发展,数字技术的整合在推动经济增长的同时,也应对着环境和社会的可持续性挑战。数据驱动技术的理论效益正通过乳业生产中有形的、可衡量的结果得到越来越多的验证。例如,采用AMS与产奶量增加2%至25%相关,同时这些系统将挤奶相关活动所需时间大幅减少了62%。精准营养模型已证明有通过更精确地满足奶牛营养需求来提高乳业性能的潜力,从而增加产奶量。实施营养分群相比传统分群系统,每年每头牛在饲料成本之上的收入(Income Over Feed Cost, IOFC)可额外增加31美元。“乳业大脑”(Dairy Brain)系统展示了通过改进营养分群,每年每头牛潜在减少99美元日粮成本的潜力,并在疾病发作前5次挤奶识别出90%的临床乳腺炎病例,通过早期干预可能减少生产损失和治疗成本。
可持续性的环境维度越来越得到精准技术的支持,这些技术有助于在保持或提高生产力的同时减少奶牛养殖的生态足迹。研究表明,精准畜牧业(Precision Livestock Farming, PLF)技术可以显著减少温室气体(Greenhouse Gas, GHG)排放。AI驱动的工具有助于制定减排策略,使农场能够在保持生产力的同时实现气候目标。此外,使用大数据分析可以优化资源分配和饲料效率,这对长期乳业生产至关重要。例如,在苏格兰进行的一项研究发现,采用自动称重平台、基于加速度计的发情检测传感器和健康监测传感器可导致温室气体排放大幅减少。
可持续性的社会维度则通过改善工人和动物福利的PDF技术得以解决。AMS最常报告的优势之一是节省时间,研究表明使用此类系统的农场劳动时间减少了29%至30%。PDF中的数字工具不仅减轻了体力负担,还增强了工作灵活性并降低了精神压力,支持农民更好的工作与生活平衡。例如,用于发情检测和健康监测的基于传感器的系统有助于减少与人工观察相关的体力和认知工作量,同时也能实现更明智的动物护理决策。采访还显示,这些技术普遍受到积极评价,特别是它们在简化牛群管理和改进日常决策方面的作用。此外,自动化程度更高、并整合到更广泛PDF系统的农场报告了更好的人畜互动、更少的跛行病例和改善的奶牛卫生,有助于提高动物福利标准。这种向集成数字解决方案的持续演进是更广泛趋势的一部分,通常被称为“乳业4.0”(Dairy 4.0),它运用机器人、AI和物联网来提升大规模奶牛养殖运营的可持续性和效率。
乳业养殖的进展与未来趋势:整合人工智能、可持续性与创新
人工智能是一个广泛的 umbrella 术语,涵盖了能够执行通常需要人类智能的任务的计算系统,例如从数据中学习、识别模式和支持决策。在这个广泛领域内,机器学习特指从示例中学习预测关系的数据驱动方法。在实践中,当代乳业科学中的大多数AI应用都是通过ML方法实现的,因此可以将其视为在乳业系统中实现AI能力的主要方法论驱动力。
ML方法能够分析大型异质数据集,包括由牛奶分析仪、摄像头和兽医诊断产生的数据,从而提高预测的准确性和精确度。这些方法有潜力通过重塑传统的牛奶成分分析、健康监测和农场管理方法来改变奶牛养殖。中红外光谱(Mid-Infrared spectroscopy, MIR)的使用为这一演变提供了清晰的例证。最初,MIR数据主要使用传统的定量方法(如线性回归)来估计有限数量的牛奶成分。随着ML方法的采用,MIR光谱现在可以得到更充分的利用,以提取额外信息,包括奶酪制作特性、甲烷排放和负能量平衡的指标,如图所示。MIR光谱分析已从传统的线性模型发展到一系列ML方法,包括偏最小二乘回归、支持向量机、决策树和深度神经网络。在牛奶成分分析领域,神经网络和偏最小二乘回归都被证明能有效处理复杂且高度相关的红外光谱数据,从而更准确地预测牛奶的营养和技术特性,以及疾病检测和环境指纹图谱。
除了牛奶成分分析,ML还可以通过将基因组学与先进的传感技术(如计算机视觉系统)相结合,彻底改变表型分析和农场管理。此外,环境组学和基因组学的整合可以更深入地了解遗传和环境因素如何塑造表型结果,这对于改进动物育种策略至关重要。Finlay-Wilkinson模型等分析方法,最初为植物育种开发,用于通过评估不同基因型在不同环境条件下的表现来分析基因型-环境相互作用,可用于探索不同环境因素如何影响奶牛和其他牲畜,从而帮助选择适应性和生产力。补充这些整合的基因组学方法,自动化传感器、挤奶机器人、成像系统和其他精准乳业工具日益广泛的使用,意味着现在可以获得大量高频表型数据。这些数据支持开发超越传统生产或体型测量之外的新性状,包括与行为、效率、健康、适应性、福利和环境影响相关的性状,其中许多显示出有意义的遗传力和遗传相关性。
使用多样化的数据类型,包括视频和传感器输入,也被证明可以提高预测模型(对于亚临床酮病和跛行等状况)的准确性,与仅依赖传统观察或单一来源数据的模型相比。此外,将表型分析和基因组学整合到这些模型中已被证明可以进一步提高其性能,实现更准确的预测。这些多样化的数据类型正通过先进的传感器技术(如2维和3维成像系统)和数据自动编码器日益被捕获和管理,从而实现实时数据(包括运动模式、采食量和环境条件)的持续收集和分析。这些多源数据流的整合支持复杂的预测性健康和监测模型以及数字孪生的发展,从而增强决策和农场管理。数字孪生是奶牛或牛群的虚拟表示,它们可以通过模拟奶牛或牛群在情况变化(如新日粮)时的表现,促进实时监测和预测分析。它们已广泛应用于工程领域,在奶牛养殖中的应用可以通过模拟决策对动物健康和生产的影响来改进牛群管理实践。
生成式AI和大型语言模型的最新发展也有可能进一步加速优化的农场决策制定和提高劳动效率,因为它们可以将复杂的数据和模型翻译成农民的语言,从而促进技术采纳。这些AI驱动的决策支持系统的有效性从根本上取决于从农场监测技术获得的数据的质量和数量。自动健康监测(Automated Health Monitoring, AHM)技术已成为现代奶牛养殖中关键的数据来源,利用可穿戴和不可穿戴传感器来监测行为、生理和生产参数。例如,在丹麦的一项研究显示,AHM系统提高了发情检测率(95%–97%),从而提高了繁殖性能,与受胎率相比传统方法提高了50%。此外,在奥地利,研究表明基于耳挂式加速度计的算法可以在产犊前1小时以74%的平衡准确度预测产犊开始。而ML算法在过滤和分析大型数据集方面起着至关重要的作用,例如,通过整合多样化的生物数据和非传感器信息,以高频率和精确度识别健康紊乱。ML应用还扩展到生产优化;例如,开发了一个深度学习框架,通过利用历史产奶量数据来增强泌乳曲线预测和预测准确性,特别是在泌乳期的前26天。然而,诸如数据异质性和疾病发生率在农场间不均等挑战,需要先进的技术,如超参数调整、数据采样和新颖的模型架构,以增强在不同环境下的适应性和诊断准确性。尽管ML算法在识别健康奶牛方面取得了成功,但它们在检测患病奶牛方面的效果不那么明显。一项研究显示,虽然一些模型(如通过牛奶中红外光谱训练用于检测疾病的神经网络)实现了高特异性(例如97%),但其检测疾病的灵敏度可能有限(例如约62%)。尽管一项研究表明,使用基于传感器的系统检测酮病和低钙血症的结果灵敏度(71%)高于特异性(43%–48%)。然而,另一项研究发现,在预测产犊后低钙血症风险方面,深度学习模型的表现优于传统模型,准确度为62%。这引发了关于此类技术在实际农场环境中部署的重要问题。解决这些挑战需要双管齐下:改进数据生态系统和增强算法可靠性。强大的数据收集系统至关重要,确保来自商业农场的多样化、高质量数据集,以训练在受控环境之外也能很好泛化的模型。算法可靠性可以通过改进数学框架(例如基于微积分的优化)并结合特征工程和集成建模等先进技术来提高。
在这些进展的基础上,奶牛养殖的未来预计将在ML、计算机视觉和各种基于传感器的系统的帮助下取得进展。这些技术的应用将提高农场生产力,促进动物福利,并增强可持续农业。健康监测系统现已超越牛奶成分分析,发展到更集成的系统,这些系统结合基因组数据、环境因素和实时表型分析,为农场管理生成预测模型。这种转变表明了农业领域更广泛的趋势,即数据驱动的决策正成为运营成功的核心。在这种背景下,奶牛养殖预计在不久的将变得更具数据驱动性和互联性。AI驱动的表型分析和健康监测系统,辅以来自传感器的实时数据,将变得司空见惯,使农民、兽医和其他利益相关者能够就动物福利和农场管理做出更明智的决策。随着农场自动化程度的提高,农民的角色可能需要从体力劳动转向包括数据管理和监督。因此,将需要新的能力,并且应开发培训计划。
技术采纳、数据集成与连接:多层次驱动因素与障碍
奶牛养殖中的技术采纳构成了提高生产力、动物福利和运营效率的基础,而数据集成和连接则是同步和协调整个供应链信息以做出更明智决策的关键组成部分。罗杰斯的扩散理论解释了创新如何基于感知价值和易于整合等因素在社会系统中传播。尽管足够的意识、信息和投资回报是技术采纳的关键驱动因素,但采用过程是复杂的,不同情境间差异显著,导致基于特定技术和当地农业条件的不采纳、部分采纳和停止采用。
农民教育、家庭规模、土地保有权和获得适当投资等因素影响技术采纳。研究确定了影响奶牛场技术采纳的12个关键促进因素:采用和维护技术的可负担性、对可用技术的认识、乳业业务经验、技术维护的便利性、技术与现有养殖实践的兼容性、管理者对技术采纳的兴趣、训练有素的劳动力的可用性、易用性、技术的感知有用性、竞争压力、技术自我效能感和数字素养。然而,缺乏政府支持、乳业教育机会有限、高成本、大量投资要求以及决策者接受度低是技术采纳的最显著障碍。值得注意的是,这些挑战并非普遍存在。美国农业部的报告显示,在1996年至2019年间,数字农业技术的采用率大幅增加,玉米、棉花和大豆等主要作物的自动化引导系统实施面积超过50%。这些发现突显了在某些情境下农业技术日益增长的接受度,但奶牛养殖系统仍面临交织的财务、教育和政策障碍,减缓了采纳速度。
与此同时,广泛的数据采纳面临诸如隐私、安全和数据共享担忧等障碍,许多农民在没有得到有保障保护的情况下不愿参与。许多农民不愿使用数字工具,因为缺乏对数据控制的透明度,公司通常在最终用户许可协议中嵌入数据所有权条款,而大多数农民可能没有完全理解或阅读。这种做法破坏了信任,并可能阻碍这些技术的更广泛采纳。为了克服这一点,技术提供商必须与农民密切合作,创建透明且互惠互利的数据共享协议。通过清晰的沟通、农民参与决策以及为数据共享制定激励措施来建立信任,对于克服这些障碍至关重要。
除了隐私和数据共享问题,技术采纳的另一个关键挑战是“技术坟墓场”的概念,指的是未能解决实际农场需求随后变得过时的技术。这些失败通常源于对奶牛生物学和农场现实理解不足,设计不适合大型动物或长期农场使用的技术,以及忽视基础设施需求、天气挑战或啮齿动物相关问题。其他陷阱包括未能解决维护要求、农村互联网连接差、过度承诺能力以及更多地关注技术本身而非其提供的可操作信息;这些持续存在的问题仍然对更广泛采纳构成重大障碍。这可能是因为技术开发者和奶牛养殖的实际现实之间经常存在脱节,一些人过于雄心勃勃地宣称产品效益,却没有生产者的有意义的意见或农场验证。低投资回报率、数据收集或分析准确性差以及缺乏与其他农场数据源的整合进一步阻碍了成功的技术采纳。例如,虽然PDF技术在改进个体奶牛管理方面显示出了前景,但它们在大规模上的实施受到高初始成本和需要专门培训的阻碍。此外,技术进步的快速步伐有时会超过农民完全整合和使用新系统的能力,导致潜在有益技术利用不足或被放弃。
另一个日益增长的担忧是多种数字工具的累积,每种工具都需要单独的订阅、维护和培训。这些系统通常缺乏互操作性,并包含重叠功能,使得保持成本效益变得困难。除了前期成本,持续费用以及更新、校准和支持等隐藏成本造成了可能超过运营效益的财务负担。大多数农场不具备管理多个并行系统的经济和后勤需求的能力。这也呼吁从以工具为中心的设计转向集成的农场层面生态系统,专注于组合价值而非重复功能。从这些失败中吸取的教训强调了团队专业知识的重要性,以及需要既用户友好又能无缝融入日常农场运营的技术。成功的采纳需要持续验证,并在投资成本和潜在回报之间保持经济平衡,有效的客户支持和数据标准发挥着关键作用。
这种对整合的需求将我们带到了数据连接的关键作用。用于监测奶牛健康的传感器系统等创新显示出了巨大前景,但它们仍然受到连接性和系统功能相关问题的阻碍。为了克服这些连接障碍,标准化的数据格式和协议至关重要,因为它们能够实现跨技术系统的无缝通信,简化工具集成,减少连接问题,并增强功能,这些共同支持更高的采纳率和改善的投资回报率。实施此类标准化系统需要强大的技术基础设施,包括集中式计算资源、安全和全面的数据库系统,以及用于奶牛养殖中数据有效共享和利用的标准化数据格式。一些现实世界的倡议例证了如何操作化这种基础设施。诸如“乳业大脑倡议”这样的实时、数据集成、数据驱动的持续决策引擎已被提出,以促进数据共享和利用,并增强奶牛场决策。同样,比利时的“WALLeSmart”平台及其模块化插件架构,被报道既作为枢纽也作为应用平台,使农业专业人员和开发人员能够构建和运行定制应用程序。它还聚合和处理多样化的农业数据集,以提供实时洞察和预测分析。
与连接性并行,准确和持久的动物标识支持可追溯性、牛群管理和遗传改良计划。历史上,管理标签是农场特定的,限制了它们在跨系统数据交换中的使用。这些问题已通过国际组织制定的国际标准得到解决,该组织根据国际标准化组织指南认证射频识别和其他标识设备,确保全球互操作性和可靠性。尽管做出了这些努力,许多农场管理系统仍然依赖内部的、非标准的ID,这些ID通常仅在特定农场内唯一或随时间重复使用,阻碍了数据集成和遗传评估。尽管新兴的生物识别解决方案(如鼻纹和视网膜成像)可能提供未来的改进,但采用标准化的动物标识系统对于完全可互操作的农场数据生态系统仍然至关重要。
尽管取得了一些进展,但数据利用的障碍依然存在。研究发现,公司以非交互格式(例如便携式文档格式、电子邮件)共享数据限制了其分析和集成,强调需要用户友好的API和直接计算机访问以充分利用数据。这些技术障碍因缺乏同时精通动物科学和数据科学的专业人员而加剧,这一差距可以通过在大学层面创建结合数字农业和数据管理的综合专业和课程等策略来缓解。此外,精准农业使生产者能够通过先进的分析更有效地应对市场波动,但跨供应商平台的整合仍然是一个主要障碍。专有数据系统通常将信息保留在孤岛中,优先考虑供应商控制而非数据可移植性和可用性。尽管国际乳业数据交换网络等倡议旨在创建数据交换的共享基础设施,但该行业的许多领域仍缺乏开放标准或激励供应商实现完全互操作性的动力。跨系统整合的缺乏进一步加剧了现有的延迟,例如实时获取IOFC等经济指标的权限,降低了分析对决策的效用。
在行业层面,大型和小型奶牛生产者在获取和利用数据方面的差异仍然是一个重大挑战,缺乏标准化进一步加剧了这一问题。尽管标准化至关重要,但各种公司利用来自农民和其他利益相关者的数据将其洞察货币化的趋势引发了伦理问题,特别是在透明度和同意方面。除了技术和人才缺口,强调了围绕“数据主权”制定法律框架日益增长的必要性,以确保公平获取数据,同时尊重数据生产者的权利。这些见解凸显了在数据集成方面解决技术和治理挑战需要合作努力。
数字技术的教育整合对于培养下一代农民和其他乳业专业人员以解决这些问题至关重要。一项针对兽医和农业学生关于下一代采纳数字技术(传感器技术)准备情况的调查表明,将此类数据驱动技术和数据分析纳入课程对于让学生具备相关技能和知识以满足未来行业需求并提高采纳准备度至关重要。然而,目前的准备率估计仅为20%至30%,尽管考虑到并非所有受训者都期望从事PLF或PDF职业,这是可以接受的,但仍突显了扩展和加强教育计划的机会。“精准动物健康”等专业硕士课程可以通过将兽医学、动物饲养和生产与现代、信息驱动的技术联系起来,进一步弥补这一差距。这种方法符合更新教育课程以满足现代农业不断变化需求的更广泛建议。
展望未来,乳业技术的未来将需要深思熟虑、负责任的方法。负责任创新等概念提供了一个框架,指导研究人员、公司、政策制定者预测、纳入、反思和应对技术发展,确保这些创新符合社会价值观、伦理考量和长期可持续发展目标。分析不采纳此类技术的原因对于激励奶牛养殖创新也很重要。
总而言之,虽然技术采纳和整个乳业供应链的数据集成提供了巨大潜