本文提出了迈向通用 CNN 架构 :CCNN,解决借单架构可以用于任意分辨率、有缺长度和维度的实现数据。
在 VGG、多项U-Net、解决借单架构TCN 网络中... CNN 虽然功能强大 ,有缺但必须针对特定问题、实现数据类型、多项长度和分辨率进行定制 ,解决借单架构才能发挥其作用。有缺我们不禁会问 ,实现可以设计出一个在所有这些网络中都运行良好的多项单一 CNN 吗 ?
本文中 ,来自阿姆斯特丹自由大学、解决借单架构阿姆斯特丹大学、有缺斯坦福大学的香港云服务器实现研究者提出了 CCNN,单个 CNN 就能够在多个数据集(例如 LRA)上实现 SOTA !

1998 年 LeCun 等人提出卷积神经网络 (CNN) ,这是一类广泛用于机器学习的深度学习模型 。由于 CNN 具有高性能和高效率等特点 ,使其在跨序列、视觉和高维数据的多个应用程序中实现 SOTA 性能。然而,CNN(以及一般的神经网络)存在一个严重缺陷 ,这些架构必须针对特定应用进行定制,以便处理不同的数据长度、亿华云分辨率和维度。这反过来又导致大量特定于任务的 CNN 架构出现。
数据可以有许多不同的长度,例如图像可以是 32x32 或 1024x1024。标准 CNN 存在的问题是,它们的卷积核是局部的 ,这需要为每个长度定制一个精心选择的步长和池化层来捕获整个上下文自定义架构 。建站模板此外 ,许多数据本质上是连续的,在不同的分辨率下具有相同的语义,例如图像可以在任意分辨率下捕获 ,并具有相同的语义内容 ,音频可以在 16kHz 或 44.1kHz 采样,但人耳听起来仍然是相同的 。
然而 ,由于卷积核的免费模板离散性,传统的 CNN 不能跨分辨率使用 。当考虑具有相同 CNN 的不同维度数据时,这两个问题会进一步加剧,例如序列(1D) 、视觉(2D)和高维数据(3D、4D),因为不同的维度以不同的特征长度和分辨率运行 ,例如一秒音频的长度很容易达到 16000,这与基准数据集中的图像大小形成强烈对比。云计算
在本文中,研究者提出了迈向通用 CNN 架构。其目标是构建一个单一的 CNN 架构 ,可以用于任意分辨率、长度和维度的数据。标准 CNN 需要特定于任务的架构,因为其卷积核的离散性将内核绑定到特定的数据分辨率 ,并且由于构建大型离散卷积核所需的大量参数,它们不适合对全局上下文进行建模。服务器租用
因此 ,为了构建一个通用的 CNN 架构 ,关键是开发一个分辨率不可知的卷积层 ,该卷积层能够以参数有效的方式对远程依赖关系进行建模。该研究入选 ICML 2022 。

论文地址 :https://arxiv.org/pdf/2206.03398.pdf代码地址 :https://github.com/david-knigge/ccnn本文的贡献如下:
该研究提出 Continuous CNN(CCNN):一个简单、通用的 CNN,可以跨数据分辨率和维度使用,而不需要结构修改。CCNN 在序列 (1D)、视觉 (2D) 任务、以及不规则采样数据和测试时间分辨率变化的任务上超过 SOTA;该研究对现有的 CCNN 方法提供了几种改进,使它们能够匹配当前 SOTA 方法 ,例如 S4。主要改进包括核生成器网络的初始化 、卷积层修改以及 CNN 的整体结构 。连续核卷积连续核卷积将小型神经网络
作为核生成器网络,同时将卷积核参数化为连续函数。该网络将坐标
映射到该位置的卷积核值:
(图 1a)
。通过将 K 个坐标
的向量通过 G_Kernel,可以构造一个大小相等的卷积核 K
,即
。随后,在输入信号
和生成的卷积核
之间进行卷积运算,以构造输出特征表示
,即