2018年 Action recognition 的匯總（ECCV CVPR AAAI）

把ECCV和CVPR還有AAAI 2018年的action recognition匯了個總，放在這裡。

ECCV 2018

Skeleton-Based Action Recognition with Spatial Reasoning and Temporal Stack Learning

Dividing and Aggregating Network for Multi-view Action Recognition

Deep Bilinear Learning for RGB-D Action Recognition

Modality Distillation with Multiple Stream Networks for Action Recognition

Interaction-aware Spatio-temporal Pyramid Attention Networks for Action Classification

Motion Feature Network: Fixed Motion Filter for Action Recognition

Spatio-Temporal Channel Correlation Networks for Action Classification

Recurrent Tubelet Proposal and Recognition Networks for Action Detection

PM-GANs: Discriminative Representation Learning for Action Recognition Using Partial-modalities

RESOUND: Towards Action Recognition without Representation Bias

CVPR 2018

MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition

Optical Flow Guided Feature: A Fast and Robust Motion Representation for Video Action Recognition

2D/3D Pose Estimation and Action Recognition Using Multitask Deep Learning

Temporal Hallucinating for Action Recognition With Few Still Images

Deep Progressive Reinforcement Learning for Skeleton-Based Action Recognition

Im2Flow: Motion Hallucination From Static Images for Action Recognition

Compressed Video Action Recognition

A Closer Look at Spatiotemporal Convolutions for Action Recognition

Temporal Deformable Residual Networks for Action Segmentation in Videos

PoTion: Pose MoTion Representation for Action Recognition

What Have We Learned From Deep Representations for Action Recognition?

Towards Universal Representation for Unseen Action Recognition

AAAI 2018

Action Recognition from Skeleton Data via Analogical Generalization over Qualitative Representations

Action Recognition with Coarse-to-Fine Deep Feature Integration and Asynchronous Fusion

Cooperative Training of Deep Aggregation Networks for RGB-D Action Recognition

Hierarchical Nonlinear Orthogonal Adaptive-Subspace Self-Organizing Map based Feature Extraction for Human Action Recognition

中文的報道：【重磅】自適應無監督學習的特徵提取方法

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

中文的報道：港中文AAAI錄用論文詳解：ST-GCN 時空圖卷積網路模型 | AAAI 2018

code: https://github.com/yysijie/st-gcn

親測，非常好用

T-C3D: Temporal Convolutional 3D Network for Real-time Action Recognition

code:tc3d/tc3d

Unsupervised Deep Learning of Mid-Level Video Representation for Action Recognition

Unsupervised Representation Learning with Long-Term Dynamics for Skeleton Based Action Recognition

Deformable Pose Traversal Convolution for 3D Action and Gesture Recognition

Junwu Weng, Mengyuan Liu, Xudong Jiang, and Junsong Yuan

School of EEE, Nanyang Technological University

Department of CSE, The State University of New York, Buffalo [email protected]

這又是一個NTU 的作品。在NTU的庫上做的東西。

本文的貢獻是3D姿勢的表徵。他們提出了一種可變形姿勢遍歷卷積網路 Deformable Pose Traversal Convolution，它採用一維卷積來遍歷3D姿勢以表示其姿態，而不是直接通過其關節位置來表示3D姿勢。在執行遍歷卷積時感受野也不是固定的，而是通過考慮具有不同權重的上下文關節來優化每個關節的卷積核。這種可變形卷積更好地利用上下文關節進行動作和手勢識別，並且對於嘈雜的關節更加魯棒。此外，通過將學習的姿勢特徵饋送到LSTM，我們執行端對端訓練，其共同優化姿勢表徵和時間序列識別。

測試了三個基準數據集的實驗驗證了我們提出的方法的競爭性能，以及它處理姿態雜訊關節的效率和魯棒性。

這篇工作是基於NTU之前的一個基本的LSTM的工作：

Liu, J., Shahroudy, A., Xu, D., Wang, G.: Spatio-temporal lstm with trust gates for 3d human action recognition. In: ECCV, Springer (2016) 816–833

code（lua）：https://github.com/kinect59/Spatio-Temporal-LSTM

來做的。

他們也是用了一個樹遍歷的方法來表示相關節點的空間臨近關係。然後用一個一維的卷積去卷。