본문 바로가기
머신러닝, 딥러닝/OCR

Simultaneous Recognition of Horizontal and Vertical Text in Natural Images (2018.12)

by 행뱁 2019. 7. 29.

DEM (Directional Encoding Mask)

- Text의 Directional information이 담겨있는, 인풋 이미지와 사이즈가 같은 2D 이미지

- 가로 텍스트의 경우: cos(0.5 * normalized_width * pi)

- 세로 텍스트의 경우: sin(0.5 * normalized_width * pi)

- 인풋 이미지와 Concatenate 되어 CNN의 인풋으로 들어가는 형태

 

SAN (Selective Attention Network)

- Text direction에 따라 다르게 행동하는 두 가지 Attention mask를 가짐

'머신러닝, 딥러닝 > OCR' 카테고리의 다른 글

Multi-GPU Model에서 h5(hdf5)를 로드하지 못하는 문제  (0) 2019.08.13
Variable Scope 공부  (0) 2019.08.13
Attention 공부  (0) 2019.08.12
Attention Is All You Need 공부  (0) 2019.08.09
ResNet 공부  (0) 2019.07.31

댓글