登录/注册

符号转移熵

更多

好的,我们来用中文解释一下符号转移熵

符号转移熵本质上是转移熵的一个特化版本,专为处理符号化(离散化)时间序列数据而设计。它是用来量化一个符号序列(信号源)对另一个符号序列(目标系统)未来状态的不确定性所减少的程度,或者说,它度量了符号序列之间定向的、动态的信息传递

以下是关键概念的分解:

  1. 符号化:

    • 现实世界的时间序列(如温度读数、脑电图信号、股票价格、文本等)通常是连续或取值连续的。符号转移熵要求先将这些连续的时间序列转化为离散的符号序列
    • 常见的符号化方法包括:
      • 粗粒化: 将连续值范围划分成有限个区间(bin),每个区间对应一个符号(如 'A', 'B', 'C' 或 0, 1, 2)。
      • 排列序(Permutation Order): 基于数据点局部窗口内的相对顺序来分配符号(这是非常流行的方法,得到的常称为“排列转移熵”)。
      • 字母表转换: 如将文本中的单词映射到特定类别。
    • 这个过程会丢失一些细节(信息损失),但能捕捉序列的模式和动态特性。
  2. 熵:

    • 概念来源于信息论,由香农提出。在这里,度量的是一个符号序列的不确定性平均信息量。如果序列非常随机(每个符号出现的概率差不多),熵就高;如果序列很有规律(某些符号总出现,其他几乎不出现),熵就低。
  3. 转移熵:

    • 这是符号转移熵的基础。转移熵克服了传统相关性和互信息在衡量动态因果关系上的不足(如不能反映信息传递方向、不能区分共享历史与动态影响)。
    • 它计算的核心是:在已知目标系统自身历史状态的前提下,了解信号源的历史状态能给目标的未来状态带来多少额外的信息(减少了多少不确定性)?
    • 数学上,它基于条件概率条件熵进行计算。
  4. 符号转移熵的定义:

    • 给定两个符号化后的时间序列:
      • 目标系统序列:Y = y(1), y(2), ..., y(t), ...
      • 信号源序列:X = x(1), x(2), ..., x(t), ...
    • 定义:
      • y(t+1):目标系统在下一个时刻 t+1 的状态(符号)。
      • y_t^k:目标系统在时刻 t 的历史状态(通常用 k 个过去符号表示,如 y_t^k = [y(t), y(t-1), ..., y(t-k+1)])。
      • x_t^l:信号源在时刻 t 的历史状态(通常用 l 个过去符号表示)。
    • 符号转移熵 TE_{X->Y}XY 的计算公式为: TE_{X->Y} = Σ p(y(t+1), y_t^k, x_t^l) * log₂ [ p(y(t+1) | y_t^k, x_t^l) / p(y(t+1) | y_t^k) ]
      • 这个求和遍历所有可能的未来状态 y(t+1)、目标历史 y_t^k 和信号源历史 x_t^l 的组合。
    • 核心理解: 这个公式计算了在已知目标自身历史 y_t^k 的前提下额外知道信号源历史 x_t^l 后,预测目标未来状态 y(t+1)条件概率的变化程度。对数项 log₂[...] 度量了这种概率变化的“信息量”,然后对所有可能情况取平均(由概率 p(...) 加权)。
  5. 符号转移熵的含义:

    • TE_{X->Y} > 0:意味着信号源 X 的历史包含有助于预测目标 Y 未来的信息(超出了仅用 Y 自身历史所能预测的信息)。这表示存在从 XY 的(可能是因果)信息流。值越大,信息流越强。
    • TE_{X->Y} ≈ 0:意味着信号源 X 的历史没有提供关于目标 Y 未来的额外信息。Y 的未来主要或完全由其自身历史决定,或者 XY 之间没有直接的动态因果关系(可能是共同驱动或独立)。
    • 方向性: TE_{X->Y} 通常不等于 TE_{Y->X},这能够帮助识别信息流动的主导方向(例如,是 X 在驱动 Y,还是相反)。
    • 动态性: 它专注于状态转移的信息,即当前状态如何影响下一个状态,能捕捉系统内部的动态信息传递机制。
  6. 应用领域:

    • 神经科学: 分析不同脑区神经元活动之间的信息流向,研究脑网络连接。
    • 金融学: 研究不同股票市场、资产类别之间的波动溢出效应和信息传导。
    • 气候科学: 分析不同气候变量(如温度、海温)之间的相互影响。
    • 复杂系统: 研究耦合系统(如种群动力学、电网、基因调控网络)各部分间的因果关系和相互作用强度。
    • 工程: 故障诊断(识别异常信息流)、控制系统分析。
  7. 优点:

    • 能捕捉非线性的关系(相比线性相关方法如Granger因果)。
    • 具有方向性(区别于互信息)。
    • 考虑了动态传递(区别于静态相关)。
    • 适用于非稳态、非线性的复杂系统。
    • 符号化处理使其对噪声有一定鲁棒性,且计算相对高效。
  8. 局限性与注意事项:

    • 符号化方法至关重要: 不同的方法(粗粒化、排列序、符号数k/l的选择)会影响结果,需要根据具体问题和数据特性谨慎选择。
    • 信息损失: 符号化过程必然丢失部分原始数据的细节。
    • 参数选择: 历史长度参数 k (目标历史) 和 l (源历史) 的选择需要通过优化(如使用目标未来预测的最小嵌入延迟)或实验确定。
    • 有限数据影响: 计算需要足够的统计数据来估计联合概率分布,数据量不足会导致估计偏差。
    • 间接影响: 高转移熵可能由直接或间接影响引起,需结合领域知识和模型进一步确认因果关系。
    • 计算复杂度: 虽然符号化降低了复杂度,但序列很长、符号表很大或 k/l 较大时,计算量仍然可观。
    • 多变量影响: 可能存在多个源共同作用的情况(多变量转移熵用于解决此问题)。

总结来说:

符号转移熵是一种在符号化时间序列数据中,计算一个系统(源)的状态历史对另一个系统(目标)的下一个状态所提供的预测信息增益(即超过目标自身历史所能提供的信息)的度量。它是评估符号序列之间定向动态因果关系和信息流动强度的核心工具。 理解它的关键在于掌握熵、条件概率、动态信息传递以及符号化离散化处理的过程。

镭射转移复合纸剥离试验机

1970-01-01 08:00:00 至 1970-01-01 08:00:00

华秋与共服务中心缔结战略合作伙伴关系

深圳华秋电子有限公司(以下简称“华秋”)与深圳市共熵产业与标准创新服务中心(以下简称“共熵服务中心”)在深圳福田区深港国际科技园签署战略合作框架协议并举行揭牌仪式。华秋副总经理曾海银与共

2023-09-28 14:56:31

LabVIEW中信号的频谱功率谱怎么求

LabVIEW中频谱熵功率谱熵怎么求

2023-06-11 20:43:46

算术编码CABAC

算术熵编码CABAC(力普拉斯电源技术有限公司)-算术熵编码CABAC                  

资料下载 王涛 2021-08-31 12:24:34

图像信息的计算公式综述

图像熵信息的计算公式综述

资料下载 辉ll 2021-07-12 14:12:54

基于局部拟合与全局信息的改进活动轮廓模型

为解决活动轮廓模型在分割灰度不均匀的图像时存在的对初始轮廓位置敏感、参数选取繁琐及迭代次数多等问题,构建一种基于局部熵拟合能量与全局信息的改进活动轮廓模型。选取灰度图像的中心作为水平集初始轮廓

资料下载 佚名 2021-05-26 15:31:30

基于MapReduce和加权网络信息的DBWGIE-MR算法

针对大数据下基于密度的聚类算法中存在的数据网格划分不合理,聚类结果准确度不高以及并行化效率较低等问题,提出了基于 Mapreduce和加权网格信息熵的 DBWGIE-MR算法。首先提出自适应网格划分

资料下载 佚名 2021-04-07 14:31:56

一种基于图极值理论的领域概念聚类方法

为在领域本体学习过程中实现最优同领域概念聚类并解决概念重叠问题,通过引入图熵极值理论,提出种新的领域概念聚类方法。依据最大信息熵原理,将图中各概念节点视为一个整体以取代原选取质心的方法同时利用图

资料下载 佚名 2021-04-01 15:39:44

igbt电气符号

igbt电气符号图 igbt电气符号图是指用于各种设备上,作为操作指示或用来显示设备的功能或工作状态的图形符号,例如:电气设备用图形

2023-02-06 10:45:24

STEP7符号/符号表使用

共享符号与本地符号 符号可以分为共享符号与本地

2023-01-29 11:55:23

基科技三大业务板块齐亮相,助力行业智能化升级

  12月26日,第十八届中国国际社会公共安全博览会(以下简称“CPSE安博会”)在深圳福田会展中心隆重召开。展会上,熵基科技以焕新品牌标识“ZKTeco熵基”C位亮相,并宣布正式启用全新的品牌

2021-12-28 07:45:00

共享符号和局部符号的区别

符号使得可以采用具有某种意义的符号名来代替绝对地址进行工作。使用简短的符号和详细的注释能满足有效程序创建和良好程序文档的要求。

2021-03-24 14:43:13

保险丝的电路符号及图形符号

本文介绍了保险丝符号的相关知识,有关保险丝的电路符号(文字符号),以及保险丝的电学符号

2020-03-29 16:08:00

什么是自适应算术编码?

算术编码是一种无失真的编码方法,能有效地压缩信源冗余度,属于熵编码的一种。算术编码的一个重要特点就是可以按分数比特逼近信源熵,突破了Haffman编码每个符号

2019-10-23 07:36:30

交叉的作用原理

交叉熵作为损失函数在神经网络中的作用和几种常用的交叉熵损失函数

2019-06-03 09:10:37
7天热门专题 换一换
相关标签