Paper/Video Anomaly Detection

Anomaly Detection in Video via Self-Supervised and Multi-Task Learning

2023. 6. 11. 22:10
목차
  1. Abstract
  2. Method
  3. Proxy task and joint learning
  4. Inference

Paper : https://arxiv.org/abs/2011.07491

Github : https://github.com/lilygeorgescu/AED-SSMTL

 

Anomaly Detection in Video via Self-Supervised and Multi-Task Learning

Anomaly detection in video is a challenging computer vision problem. Due to the lack of anomalous events at training time, anomaly detection requires the design of learning methods without full supervision. In this paper, we approach anomalous event detect

arxiv.org

Abstract

self-supervised + multi-task learning at object level

self-supervised task

  1. forward/backward moving object 에 대한 구분(discrimination)
  2. 연속적/간헐적인 프레임에서의 객체 구분
  3. 특정 객체 특징 정보 재구성

Multitask

  1. Self-supervised
    1. Arrow of time → move backward 확률
    2. Motion irregularity → motion intermittent 확률
    3. Middle box prediction → MSE(reconstruction ↔ ground truth)
  2. knowledge distillation task
    1. Model distillation → class 확률 차이 (distillation ↔ yolov3)

→ 위 4개의 score를 평균내어 anomaly score로 사용함.

  • AD 대용으로 learning the arrow of time 제안
  • AD 대용으로 motion irregularity prediction 제안
  • video AD 대용으로 model distillation 제안
  • 3개의 self-supervised task 와 1개의 knowledge distillation task를 하나의 단일 모델로 결합하여 video Anomaly Detection을 수행하였음.

Method

Training

pre-trained detector 거쳐 frame i → object-centric temporal sequence 생성.(i-t,…,i-1,i,i+1,…,i+t)

이는 각 객체마다 i-t ~ i+t 까지의 bbox 데이터 묶음으로 볼 수 있다.

이 object-centric temporal sequence를 3D CNN에 input으로 넣게 된다.

tracking은 수행하지 않는다.

Inference

각 task에서 도출된 score를 평균 내 anomaly score를 뽑는다.

  • arrow of time, motion irregularity → temporal sequence 가 backward 또는 intermittent(간헐적)일 확률
  • middle frame prediction → difference between gt and reconstruct object.
  • knowledge distillation → difference between the class probability YOLO and distillation branch.

inference시 ResNet50은 포함하지 않음.

Neural Architecture

Multitask에 걸맞게 CNN의 width와 depth를 증가시켰다.

좌측 상단부터 shallow+narrow, shallow+wide, deep+narrow, deep+wide

각 CNN은 하나의 task 수행.

각각의 네트워크에서 RGB input size = 64 x 64 pixels.

이 3D CNN은 encoder 단계에서 사용함.

3D CNN 마지막 Layer에서 global-temporal pooling 사용하여 head 단계에서 2D CNN사용 가능.

decoder 단계에서는 2D CNN 사용.

이 때 각 upsampling과 conv layer는 3D CNN과 동일한 수로 이루어짐.

 

Proxy task and joint learning

task 1 : Arrow of time

각 object centric sequence 마다 2개의 labeled training sample 생성.

  1. forward motion
  2. backward motion

→ anomalous motion일수록 예측 어려움.

Task 2 : Motion irregularity

각 object centric sequence 마다 2개의 labeled training sample 생성.

  1. consecutive
  2. intermittent(skip some frame)

→ intermittent object centric sequence 가 irregular motion으로 label됨.

Task 3 : Middle bounding box prediciton

normal video 로 학습시킨 모델에서 frame i 에 해당하는 middle bbox는 reconstruction된다.

이 때 anomalous object는 Loss가 클 것이다.

Task 4 : Model distillation

3D CNN에서 ResNet-50의 마지막 layer에서 나오는 feature를 예측하도록 학습한다.(pretrained on ImageNet)

3D CNN에서 YOLOv3에서 예측하는 class 확률을 예측하도록 학습한다.(pretrained on MS COCO)

즉, distillation 단계에서 모델은 teacher(ResNet-50, YOLOv3) 의 예측하는 행동을 학습한다.

inference 단계에서 abnormal 객체가 들어왔을 때 student와 teacher의 예측 값은 상이할 것이다.

3D CNN 을 공유하므로 joint된 loss를 사용하여 업데이트한다.

 

Inference

  1. probability of the temporal sequence to move backward as the anomaly score.
  2. probability of the gapless test sequence X to be intermittent as a good abnormality indicator.
  3. mean absolute error between the reconstructed and the ground-truth middle object as the anomaly score.
  4. absolute difference between the class probabilities. (predictor ↔ YOLOv3)
저작자표시 (새창열림)
  1. Abstract
  2. Method
  3. Proxy task and joint learning
  4. Inference
Shy_un
Shy_un
Shy_un
SSHub
Shy_un
전체
오늘
어제
  • 분류 전체보기
    • KaAI
      • CPWC
      • KSC2022
      • KSME2023
    • Paper
      • Video Anomaly Detection
      • Traffic Accident Detection
      • Prediction and Tracking
      • Perception
    • Code
      • preprocess
      • Autoware
      • 3D tracking
      • Review
      • Debug
    • Dataset
      • Argoverse2 dataset
      • TJ4DRadSet
      • K-Radar
      • Nuscenes
      • Dual-Radar
    • Seminar
    • Paradigm
    • Ubuntu

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • self-supervised learning
  • Traffic accident detection #Unsupervised learning #GRU #Autoencoder
  • video anomaly detection

최근 댓글

최근 글

hELLO · Designed By 정상우.
Shy_un
Anomaly Detection in Video via Self-Supervised and Multi-Task Learning
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.