看啥推荐读物
专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

数据蒋堂 | 内存数据集产生的隐性成本

数据派THU  · 公众号  · 大数据  · 2019-04-20 19:00
作者:蒋步星来源:数据蒋堂本文共1500字,建议阅读7分钟。本文带你了解内存数据集的工作原理。当我们要对数据做一些非常规的复杂运算时,通常要将数据装入内存。现在也有不少程序设计语言提供了内存数据集对象及基本的运算方法,可以较方便地实现这类运算。不过,如果对内存数据集的工作原理了解不够,就可能写出低效的代码。我们看数据集的产生。比如要生成一个100行2列的数据集,第一列x为序号,第二列xx是第一列的平方。第一种方法,先生成一个空数据集,再一行一行地追加数据进去。AB1=create(x,xx)2for 100>A1.insert(0,A2,A2*A2)第二种方法,直接产生相应行数的数据集。AB1=100.new(~:x,~*~:xx)这两种方法产生的结果集相同,实质的循环次数和每次循环的计算内容 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照