Leon Yi

03 循环神经网络模型(Recurrent Neural Network Model)

1. 为什么标准神经网络不适合序列数据?   尝试使用标准全连接神经网络处理序列数据(如命名实体识别)存在两个主要缺陷: 输入/输出长度不固定:不同句子的单词数量不同,标准网络难以处理变长输入。即使通过填充(Padding)统一长度,也不是最优的表达方式。 无法共享特征:标准网络在不同位置学到的特征无法共享。例如,如果在位置1学到了“Harry”是人名,网络无法自动将在位置5出...

01 为什么选择序列模型?(Why Sequence Models?)

1. 核心概念   序列模型是深度学习中极具变革性的技术,特别适用于处理序列数据。传统的神经网络难以有效处理具有时间依赖性或顺序结构的数据,而循环神经网络(RNN)等序列模型在此类任务中表现卓越。 2. 典型应用场景   笔记列举了七个主要的应用领域,展示了输入 $x$ 和输出 $y$ 的不同组合形式: 语音识别 (Speech Recognition) ...

揭秘微信“快捷登录”:为什么你不用扫码就能直接登录?

摘要:你是否注意过,当电脑上挂着微信时,网页登录不再需要掏出手机扫码,而是直接弹出一个“微信快捷登录”的按钮?这背后并非魔法,而是一场浏览器与本地客户端之间精妙的“密谋”。本文将深入源码,拆解这一体验背后的技术原理。 引言:从“扫码”到“一键”的体验跃迁   曾几何时,PC 端网页登录微信生态的唯一方式就是:打开网页 -> 掏出手机 -> 微信扫码 -> 手机确认...

11 一维到三维推广(1D and 3D generalizations of models)

11 一维到三维推广(1D and 3D generalizations of models) 一、核心思想 卷积神经网络(ConvNets)最初为处理 2D 图像 而设计,但其核心机制——局部感受野 + 权重共享 + 平移不变性——具有高度通用性,可自然推广至 1D 时间序列 和 3D 体数据(如医学影像、视频) 。 关键洞察:卷积操作的本质是 滑动窗口特征检测器,维度只是输入...

07 CNN特征可视化(What are deep ConvNets learning?)

07 CNN特征可视化(What are deep ConvNets learning?) 一、核心问题:深度卷积神经网络到底在学什么? 深度卷积神经网络(ConvNets)通过多层非线性变换从原始图像中自动提取特征。理解每一层学到的内容,有助于: 解释模型行为 调试网络结构 构建高级应用(如神经风格迁移) 本节通过特征可视化方法,揭示不同深度隐藏单元所响应的图像模式...