数据集#

作者: Liuhui & Jiangbo

NMNIST#

NMNIST(here) 数据集是用于神经形态计算研究的数据集。它是对经典MNIST手写数字数据集的扩展和改进。

  • 60000个训练样本

  • 10000个测试样本

  • 28x28手写数字图像

与传统的MNIST数据集不同,NMNIST数据集专为神经形态计算设计,它通过脉冲编码的形式来表示图像。在NMNIST中,每个像素值都被转换成一系列随时间变化的脉冲信号,这种编码方式更贴近生物神经系统的工作机制。这样的表示方法使得神经形态计算机在处理和识别图像时能够更加高效。

每个像素值经过脉冲信号编码,并且每个样本都被标记为相应的数字,代表图像中显示的数字。使用NMNIST数据集进行研究,有助于深入探索脉冲编码和脉冲神经网络在视觉处理和模式识别任务中的潜力。

此外,NMNIST数据集还可以作为一个基准,用于评估不同神经形态计算模型和算法的性能。它能够帮助研究人员比较和识别各种模型在处理脉冲编码图像时的优势和局限性。

DVS128Gesture#

这个数据集被用于构建实时手势识别系统,该数据集在CVPR 2017的论文《 A Low Power, Fully Event-Based Gesture Recognition System》中被应用。数据是使用DVS128记录的。该数据集包含来自29位受试者的11种手势,在3种光照条件下进行记录。该数据集有:

  • 1176个训练样本

  • 288个测试样本

HSD#

海德堡脉冲数据集(Heidelberg Spike Data,HSD)由两部分组成:脉冲海德堡数字数据集(Spiking Heidelberg Digits,SHD)和脉冲语音命令数据集(Spiking Speech Commands,SSC)。 这个数据集旨在促进脉冲神经网络在音频分类任务中的研究、评估和应用。

SpikingHeidelbergDigits#

脉冲海德堡数字数据集(SHD) (here)包含大约10000条高质量的录音,其中包括0到9的口语数字,既有德语又有英语。这些录音来自12位不同的讲话者,其中两位仅出现在测试集中。

Name

Classes

Samples (train/valid/test)

URL

SHD

20

8156/-/2264

https://zenkelab.org/datasets/hd_audio.tar.gz

SpikingSpeechCommands#

脉冲语音命令数据集(SSC) (here)基于谷歌发布的语音命令,由多个讲话者在较不受控制的条件下录制而成。它包含来自多个讲话者的35个单词类别。

Name

Classes

Samples (train/valid/test)

URL

SSC

35

75466/9981/20382

https://arxiv.org/abs/1804.03209