DEM (Directional Encoding Mask)
- Text의 Directional information이 담겨있는, 인풋 이미지와 사이즈가 같은 2D 이미지
- 가로 텍스트의 경우: cos(0.5 * normalized_width * pi)
- 세로 텍스트의 경우: sin(0.5 * normalized_width * pi)
- 인풋 이미지와 Concatenate 되어 CNN의 인풋으로 들어가는 형태
SAN (Selective Attention Network)
- Text direction에 따라 다르게 행동하는 두 가지 Attention mask를 가짐
'머신러닝, 딥러닝 > OCR' 카테고리의 다른 글
Multi-GPU Model에서 h5(hdf5)를 로드하지 못하는 문제 (0) | 2019.08.13 |
---|---|
Variable Scope 공부 (0) | 2019.08.13 |
Attention 공부 (0) | 2019.08.12 |
Attention Is All You Need 공부 (0) | 2019.08.09 |
ResNet 공부 (0) | 2019.07.31 |
댓글