虚拟机vs容器
虚拟机和容器采用了不同的虚拟化方案
虚拟机
- 我们所说的虚拟机就是硬件的虚拟化,基于硬件层实现
- 硬件层之上的是虚拟机监控程序负责为各个硬件创建虚拟化环境,这些虚拟组件共同组成计算机系统
- 我们与虚拟化的硬件交互,虚拟机监控程序会为我们管理实际硬件的情况。
- 这个是 Type1 型虚拟化,完全虚拟化或全系统虚拟化
- Type2 型虚拟化运行在更高层级,比如 VirtualBox 或 Parallels软件,更加轻量。
- 机器级隔离,实现一台服务器模拟多台设备,各虚拟机相互独立运行。
- 虚拟机可自定义内存大小,系统配置灵活。
容器
-
基于硬件层但架构不同,硬件层上还有操作系统内核负责协调软件和硬件间的通信,内核上部署操作系统承载所有容器,所以是操作系统级的虚拟化。
-
进程级隔离,使用容器时应用程序只能访问必需的核心资源与其他资源一概隔离,好像每个容器都有独立系统。
-
命名空间的可定制性,控制组限制资源访问量,监控资源使用,精确控制各容器资源分配。
-
容器的优势在于超强的可移植性,只需 Dockerfile 文件就能快速部署应用在本地运行。
虚拟机和容器技术并非排斥选项,而是能根据需求灵活配合的技术方案。
数据分割
- 对非时间序列数据可以随机分割得到训练集和测试集
- 对时间序列数据必须保证训练集必须早于测试集
- 时间序列有传递性,前后的数据具有因果关系,后面的数据其实其本身已经包含了前面所有时间的信息,是前面的因及对应时间下其他因素共同导致的结果,就像预测股价,金融经济学中有效市场假说中弱式有效市场认为,在任何时间点,股票的价格已经完全反映了所有可获得的信息。