十年网站开发经验 + 多家企业客户 + 靠谱的建站团队
量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决
好久没有更新文章了,学校的教材发下来了,作业一下就变多了。
成都创新互联公司坚持“要么做到,要么别承诺”的工作理念,服务领域包括:成都网站制作、成都做网站、外贸营销网站建设、企业官网、英文网站、手机端网站、网站推广等服务,满足客户于互联网时代的玛曲网站设计、移动媒体设计的需求,帮助企业找到有效的互联网解决方案。努力成为您成熟可靠的网络建设合作伙伴!
首先,把最终效果放出来:
运用样条插值,即 B-Spline ,可以使你在图表中使用曲线连接离散数据(在插值法中,这些离散数据称为 节点 )
正如你在上面所看到的那样,在Python中插值非常简单, Scipy 中的 interpolate 为你提供了样条插值所需要的一系列函数。
import部分就不多说了,
这里首先定义了一系列节点,这里数据是随机的,
接下来,首先使用 linspace 为插值提供所需的x值, splrep 根据节点计算了样条曲线的参数,最后将其传递给 splev 计算插值后的结果。
你可能是抱着想要用曲线连接节点的目的来看这篇文章,但看到这里还没搞懂插值法是个什么玩意,那么接下来的内容就是在讲数学中的插值法,与Python和Scipy已无关联。
插值法,就是在给定的节点中作出合适的函数,使得这条曲线 经过每一个节点 ,这也就是为什么在数据可视化中使用插值而不是其他方法的原因,因为插值后仍然能够准确知道每一节点所对应的值。
那么,是不是节点越多,插值的准确性就越高呢?
貌似是这样,毕竟节点越多,对曲线的限制条件就越多,那准确性不久越高了。
但是呢,如果你使用多节点直接插值(不是在程序中插值,因为程序会使用分段样条插值),你就会发现,曲线在两段有明显的震荡,并且节点越多,震荡越明显、越大:
这种现象被称为 Tolmé Runge 现象( 龙格现象 ),描述的就是这一问题。对此的数学证明在知乎上有, 传送门 。
通过龙格现象,我们会发现,当节点数量趋向于无穷时,插值的误差会趋向于无穷大:
那么,如何避免这一情况呢,可以把我们原先的等距节点替换成Chebyshev节点,但是如果我们的离散数据确实等距,这一方法不好用,那么就可以才用分段插值,我们的程序对龙格现象也是这样处理的。
分段插值就是将高次多项式拆分成多个低次多项式,一般都拆分成三次多项式。
由于插值和拟合常常一起出现,所以这里也简单提一下拟合。
拟合是对你给出的离散数据,作出于数据 差距最小 的函数,另外,按照拟合的结果,拟合也分线性拟合和非线性拟合。
拟合与插值的差别就在于,插值必须过节点,但是拟合不需要,所以拟合曲线的整体效果会更好,也就是更平滑。
拟合一般都用在数据分析里,因为拟合曲线更能够看出整体的变化趋势嘛。
这篇文章写起来难度还是想当大,如果我的描述有问题的话,欢迎评论区留言。
前往我的博客查看本文
spline函数可以实现三次样条插值 x = 0:10; y = sin(x); xx = 0:.25:10; yy = spline(x,y,xx); plot(x,y,'o',xx,yy) 另外fnplt csapi这两个函数也是三次样条插值函数,具体你可以help一下!
在 数学 学科 数值分析 中, 样条 是一种特殊的 函数 ,由 多项式 分段定义。样条的 英语 单词spline来源于可变形的样条工具,那是一种在 造船 和 工程制图 时用来画出光滑形状的工具。在中国大陆,早期曾经被称做“齿函数”。后来因为工程学术语中“放样”一词而得名。
在 插值 问题中,样条插值通常比 多项式插值 好用。用低阶的样条插值能产生和高阶的多项式插值类似的效果,并且可以避免被称为 龙格现象 的数值不稳定的出现。并且低阶的样条插值还具有“保凸”的重要性质。
在 计算机科学 的 计算机辅助设计 和 计算机图形学 中,样条通常是指分段定义的多项式 参数曲线 。由于样条构造简单,使用方便,拟合准确,并能近似 曲线拟合 和交互式曲线设计中复杂的形状,样条是这些领域中曲线的常用表示方法。
scipy.interpolate.splrep(x,y,w = None,xb = None,xe = None,k = 3,task = 0,s = None,t = None,full_output = 0,per = 0,quiet = 1 )
找到一维曲线的B样条曲线表示。
给定数据点集,确定区间上度k的平滑样条近似。(x[i], y[i])xb = x = xe
x,y: array_like
定义曲线y = f(x)的数据点。
w: array_like,optional
权重的严格正秩1数组,其长度与x和y相同。权重用于计算加权最小二乘样条拟合。如果y值中的误差具有矢量d给出的标准偏差,则w应为1 / d。默认值为1(len(x))。
xb, xe:float, optional
适合的间隔。如果为None,则它们分别默认为x [0]和x [-1]。
k: int,optional
花键拟合的程度。建议使用三次样条。甚至应避免使用k值,尤其是在s值小的情况下。1 = k = 5
task:{1, 0, -1}, optional
如果task == 0,则在给定的平滑因子s下找到t和c。
如果task == 1,则找到t和c作为平滑因子s的另一个值。对于同一组数据,必须先前有一个task = 0或task = 1的调用(t将存储为内部使用)
如果task = -1,则找到给定结点t的加权最小二乘样条曲线。这些应该是内部结,因为两端的结将自动添加。
s:float, optional
平滑条件。满足以下条件来确定平滑度:sum((w (y-g)) * 2,axis = 0)= s其中g(x)是(x,y)的平滑插值。用户可以使用s来控制贴合度和贴合度之间的权衡。较大的s表示更平滑,而较小的s表示较不平滑。s的推荐值取决于权重w。如果权重代表y的标准偏差的倒数,则应在(m-sqrt(2 * m),m + sqrt(2 * m))范围内找到一个好的s值,其中m是x,y和w中的数据点。默认值:如果提供了权重,则s = m-sqrt(2 * m)。如果未提供权重,则s = 0.0(内插)。
t:array_like, optional
任务= -1所需的结。如果给出,则任务自动设置为-1。
f:full_outputbool, optional
如果非零,则返回可选输出。
per:bool, optional
如果非零,则将数据点视为周期为x [m-1]-x [0]的周期,然后返回平滑的周期样条近似。不使用y [m-1]和w [m-1]的值。
quiet:bool, optional
非零以禁止显示消息。不推荐使用此参数;请改用标准的Python警告过滤器。
Returns:
tck:tuple
元组(t,c,k),包含结向量,B样条系数和样条度。
fp:array, optional
样条近似值的平方残差的加权总和。
ier:int, optional
有关splrep成功的整数标志。如果ier = 0,则表示成功。如果[1,2,3]中的ier发生错误,但未引发。否则会引发错误。
msg:str, optional
对应于整数标志ier的消息。
下面插值一个函数