前言


这几年养猪行业正在发生革命性的变化,高端猪肉、安全猪肉、品牌猪肉等特色猪肉的出现,一方面保证了食物的质量,另一方面也提升了溢价能力。基于人工智能养的猪,从出生之日起就有自己的数字档案,里面记载了猪的品种、日龄、体重、进食情况、运动强度、频次、轨迹等信息;用视频图像分析检测猪的体态,分析猪的健康状况;结合声学特征和红外测温技术,还能对猪的咳嗽等行为判断是否患病,做出疫情预警,马云家的猪、阿里的“智能猪”就是很成功的例子。


 

一、问题回顾

1.1 问题背景

作为一个养猪大国,养猪水平相较于发达国家还是存在相当大的差距。据数据统计,欧美国家的母猪一年能够商品猪的能力在30-40头,而我国仅能提供17-18头。近年来,我国的养猪行业正向着现代化、标准化发展。在现代化畜牧养殖场中,往往已实现了半自动化,例如,自动投喂、自动清粪系统、自动环境控制系统等,自动化设备可以反馈一些状态数据,而且通过传感器可以收集到一定的结构化数据,同时,需人工判断与记录的数据也会很好地按既定格式保存在服务器中,以上我们称之为养殖大数据。
1.2 问题解决
数据准备:
a.传感器采集的饲养方案数据。如温度、湿度、饲喂饲料量等。未来随着物联网技术的发展,将有更多的数据可通过传感器收集,如体温、运动图像等。
b.人工采集并记录的种猪数据。如品种、胎次、疾病情况、肥瘦程度等。
c.种猪的生产成绩。主要是生仔总数和健康仔猪数。其中以健康仔猪数为最重要的指标,但健康仔猪数占生仔总数的比例也需考虑提升。
基于收集到的三类数据(a,b,c)解决以下问题
建立关系分析模型,以参数形式表征自变量对猪的生产成绩的影响程度;
对(1)中影响较大的因素记为显著因子,建立显著因子对猪的生产成绩的影响的模型,求出最优解或最优解的趋势。
1.3 研究意义

第一,我国人口较大,需求量巨大,但养猪行业生产水平较低,严重影响了我国养猪事业的发展,因此,推动养猪行业的自动化、现代化发展有助于满足人类的需求,还能销往邻国谋取经济效益;
其次,改善猪肉的质量,杜绝“瘦肉精”的出现,从而人们能够放心吃肉,敢于吃肉;
最后,随着技术的应用,促进了对养猪技术的研究,养猪科学探索的深入,不断产生新技术、新理念,更好地服务于养猪企业。

 

二、模型假设

基于数据,假设猪的生产成绩只与温度、湿度、品种、胎次、肥瘦程度和患病情况有关
假设给出的数据都是有效的
假设没有重大的疫情导致猪的死亡

 

三、模型建立

3.1 问题分析

 


对于问题(1),建立关系分析模型以参数形式表征种猪的生产成绩的影响程度。由于数据中给出的影响指标有11个之多,包括日平均温度、日平均湿度、周平均饲喂量、猪品种、肥瘦程度、胎次、是否患蓝耳病、是否患圆环病、是否患仔猪黄白痢、是否患病毒性腹泻以及是否患支原体肺炎,考虑到各变量间并非一定相对独立,所以决定先根据定性分析和定量分析相结合对其进行分组,即降维,再研究各变量组对猪生产成绩的影响。

3.2 指标分组
1)定性分析

定性分析是依据现实经验和主、客观分析方法,对于某种事物的本质属性、发展趋势或多种事物之间的相关关系基于直观、概括性表述的一种分析方法。由生活经验可预测变量间的相关性,从而大致研究以下几组:
日平均温度与日平均湿度
品种、饲喂量和肥瘦程度
胎次与是否患病
肥瘦程度与是否患病
品种与是否患病
2)定量分析
定量分析是指在数学方法基础上,通过研究社会现象的数量特征、数量关系和数量变化,对发展趋势进行分析、预测和解释。

 

 

 

相关性分析

为了使得效果显著,先用对数函数对温度、湿度值进行转化,再通过excel散点图分析各变量间相关性,得到图1-3:
 








分析可知,日平均温度和日平均湿度的相关系数为0.0189,所以可以认为两者不相关(见图1);周平均饲喂量与猪的肥瘦程度的相关系数为0.8197,两者有较强的相关性,且是负相关的关系,猪越胖,饲喂量就会减少(见图2);品种与猪的肥瘦程度的相关系数为0.00001,非常弱,说明两者完全不相关(见图2);胎次与猪的肥瘦程度没有关系(见图3)


 

 

独立性检验分析

由于“是否患病”变量是布尔类型,只有“患病”、“不患病”,即1和0两种结果,所以不适合用散点图进行相关性分析,这时可用考虑独立性检验分析法。


独立性检验是检验两个分类变量X和Y是否有关系的一种统计方法,利用随机变量确定在多大程度上可以认为“两个分类变量有关系”,其中令X={x1,x2},Y={y1,y2}。

 

检验步骤:

步骤1:假设X和Y有关系

步骤2:建立2×2列联表



步骤3:计算观测值



其中观测值越大,X和Y有关系的可能性越大。

步骤4:对比临界值表



步骤5:得出结论

 

 

在实现之前,先对数据作以下处理:

鉴于猪的肥瘦程度在12-20之间,故将其划分为两部分,16-20之间表示肥胖,用1表示;12-15之间表示瘦弱,用0表示;

品种1、2分别转换为0、1

 

在matlab实现5种疾病、品种与肥瘦程度的相关性程度,得到猪的肥瘦程度与5种疾病、品种的观测值:



对比临界值表发现,只有第二种疾病(即圆环病)与猪的肥瘦程度有较大的关系,超过85%的把握认为两者有关。

 

3)确定分组

根据前面的分析大致将影响猪的生产成绩的因素分为5组,分别是

A组:日平均温度

B组:日平均湿度

C组:饲喂量、猪的肥瘦程度、圆环病

D组:胎次

E组:是否患病

3.3 建立模型

1)多元回归


设因变量为y,k个自变量分别为x1,x2,…,xk,描述因变量y如何依赖于自变量x1,x2,…,xk和误差项ε的方程称为多元回归模型。针对5组影响因素建立猪的生产成绩的回归模型如下:



其中Y表示猪的生产成绩,β0表示常数项,βi (i=1,2,3,4,5)表示5个影响猪的生产成绩的回归系数,Xi
(i=1,2,3,4,5)表示A,B,C,D,E这5组影响因素。

2)模型实现

先对变量组做以下处理:

对119个日平均温度取平均值

对119个日平均湿度取平均值

对17个周平均饲喂量取平均值

针对C组变量,由于三者有联系,在这里只考虑猪的肥瘦程度

对desease1,3,4,5取患病总数

对每个衡量指标进行归一化(即(x-min)/(max-min))

3)结果呈现

对仔猪总数的分析结果:

 



 



可见,对仔猪数目的影响程度从大到小依次为胎次、肥瘦程度、患病、湿度、温度。

 

 

对健康仔猪占的比例的结果分析:

   



可见,对健康仔猪比例的影响程度从大到小依次为肥瘦程度、湿度、胎次、温度、患病数。

4)结果分析

综合两者,影响猪的生产成绩程度最深的是猪的胎次,其次为猪的肥瘦程度、患病数,而温度和湿度对猪的影响不大。

       胎次
之所以影响最大,是因为母猪的最佳生产期为5~6胎,超过6胎的不仅会影响到生产成绩,还会增加养殖成本,所以为了提高整个生产水平,应该尽可能的淘汰生产了8胎以上的母猪。

      猪的肥瘦程度
也对生产成绩产生不可估量的影响,一旦母猪过度肥胖,脂肪过剩从而影响胎儿的正常发育,出现各种疾病,特别是圆环病,所以在母猪怀孕期间,控制好猪的饲喂量,进而控制母猪的体重,有利于保证猪的生产成绩。

      患病与否直接影响猪的生产性能和仔猪的健康状况,很明显患的疾病越多越严重,猪的生产成绩必定下降越厉害。

 

四、附录

matlab实现5种疾病、品种与肥瘦程度的相关性程度的代码
y=xlsread('数据.xlsx','肥瘦与患病','B2:B15001'); %%肥瘦程度
x=xlsread('数据.xlsx','肥瘦与患病','C2:C15001'); %%desease1
%x=xlsread('数据.xlsx','肥瘦与患病','D2:D15001'); %%desease2
%x=xlsread('数据.xlsx','肥瘦与患病','E2:E15001'); %%desease3
%x=xlsread('数据.xlsx','肥瘦与患病','F2:F15001'); %%desease4
%x=xlsread('数据.xlsx','肥瘦与患病','G2:G15001'); %%desease5
%x=xlsread('数据.xlsx','肥瘦与患病','I2:I15001'); %%品种 y=y'; x=x'; n=size(y,2);
a=sum(x==1 & y==1); b=sum(x==1 & y==0); c=sum(x==0 & y==1); d=sum(x==0 & y==0);
k2=n*(a*d-b*c)^2/((a+b)*(c+d)*(a+c)*(b+d))

友情链接
KaDraw流程图
API参考文档
OK工具箱
云服务器优惠
阿里云优惠券
腾讯云优惠券
华为云优惠券
站点信息
问题反馈
邮箱:[email protected]
QQ群:637538335
关注微信