KONAN TECHNOLOGY

FAQFAQ

코난테크놀로지의 제품 및 서비스에
대해
자주 묻는 질문들을 모았습니다.

Q

Konan DigitalArc

A

고품질 비디오와 저품질 비디오는 동일한 입력을 받아서 같은 시점에 동일한 Frame rate로 인코딩합니다.

그리고 인코딩 후처리 과정에서 시작 시점이 일치하는 지를 확인하고 Frame 단위의 인덱스를 만들면서 두 비디오간의 Sync.를 정확하게 맞추게 됩니다.

따라서, 가편집 또는 EDL 편집과정에서는 저품질의 비디오를 사용하여 효율적으로 검색하고 편집하여 EDL을 생성합니다.

Q

Konan DigitalArc

A

KONAN Cataloger는 MPEG-1, MPEG-2, MPEG-4 포맷의 다양한 디지털 비디오를 디코딩하여 프레임 단위로 분석하여 다음과 같은 정보를 자동으로 추출하고 KONAN Contents Manager에 저장하여 자산관리 시스템으로 관리를 합니다. – 장면 전환 인식에 의한 Keyframe 추출 – Keyframe 이미지를 스캔하여 얼굴 이미지 추출 – VBI에서 텍스트 추출 – 음성 인식에 의한 텍스트 추출(예정) – 음성과 대본의 Alignment(예정) – SMPTE 타임코드 – File Offset – Frame Offset

Q

Konan DigitalArc

A

Image Descriptor는 Keyframe, Face 등의 이미지를 표현하는 수단으로써 장면 전환 추출시 이미지 비교에 사용하고 유사 이미지 검색에서도 사용합니다.

Image Descriptor는 Color, Edge, Texture, Shape, Motion, 그 밖의 여러 MPEG-7의 Image Descriptor 등을 사용하여 단지 65 Byte만으로 이미지의 특징을 표현할 수 있도록 정의하였습니다.

Q

Konan DigitalArc

A

Cut을 기준으로 장면 전환을 찾습니다.

그리고, dissolve, fade, wipe와 같이 점진적으로 서서히 장면이 전환 되는 경우에도 장면 전환으로 인식합니다.

그러나, Object의 motion이나 Pan, Tilt, Zoom, Boom과 같이 Camera의 motion에 의해 나타나는 이미지는 같은 내용을 담고 있는 이미지로 인식하여 장면 전환으로 인식하지 않습니다.

장면 전환을 찾아 Keyframe을 생성하는 것은 기본적으로 각 이미지에 대한 Image Descriptor의 Difference(차)를 계산하여 얻어내는 것이므로 장면 전환을 결정하는 Difference 값의 조절을 통해 비디오에서 생성되는 Keyframe의 수를 조절할 수 있습니다.

Q

Konan DigitalArc

A

Keyframe은 장면 전환 인식의 결과로 결정되는 구간을 대표하는 하나의 이미지입니다.

따라서 Keyframe의 수는 비디오가 얼마나 많은 장면 전환이 있느냐에 의해 결정됩니다.

일반적으로 2시간짜리 비디오의 경우 약 1,000장 정도의 Keyframe이 만들어 지지만 액션 영화인 경우에는 훨씬 많은 양의 Keyframe이 추출될 것입니다.

반면에 화면의 움직임이 적게 나타나는 다큐멘터리 비디오의 경우에는 훨씬 적은 양의 Keyframe이 추출될 것입니다.

Keyframe은 이미지 검색과 스토리보드를 구성하는데 사용되며 컨텐츠 매니저에 15 KB 정도 크기의 JPEG 이미지 파일과 Image Descriptor로 저장됩니다.

Q

Konan DigitalArc

A

음성 인식 기능은 음성 인식기를 API 레벨에서 연동하여 추가할 수 있습니다.

그러나, 현재까지의 음성 인식 제품이 고객이 원하는 정도의 성능을 제공하지 못하기 때문에 현재 KONAN Cataloger에서는 기능을 제공하고 있지 않습니다.

그러나, 고객이 원하는 어느 회사 제품의 언어라도 SDK가 제공되면 기능을 추가할 수 있으므로 고객의 요청에 따라서 KONAN Cataloger에서 음성 인식 기능을 제공할 수도 있습니다.

Q

Konan DigitalArc

A

얼굴은 Keyframe 이미지를 스캔하여 자동으로 찾아냅니다.

최소 20 x 20 pixel 크기의 얼굴에서부터 다양한 크기의 얼굴을 찾습니다.

얼굴은 Keyframe과 마찬가지로 타임코드를 가지므로 비디오에서 얼굴이 나타난 위치를 정확하게 찾을 수 있으며 그 위치부터 재생할 수 있습니다.

얼굴 추출은 매우 복잡하고 시간이 많이 걸리는 작업이지만 고속의 알고리즘을 사용하여 얼굴을 추출하더라고 실시간 이상의 속도로 카타로깅이 가능합니다.

얼굴 추출의 정확도는 얼굴 학습 데이터량에 의해 결정됩니다. 얼굴 학습 데이터는 선택 사양으로 고객이 원하는 정확도에 따라 선택할 수 있습니다.

Q

Konan DigitalArc

A

비디오에 Closed Caption 신호가 포함되어 있는 경우에는 텍스트를 추출할 수 있습니다.

아날로그 비디오는 VBI(vertical blanking interval)의 line21 field에 Closed Caption이 포함되어 있는 경우 텍스트를 추출합니다.

예를 들면, 국내 공중파 방송의 뉴스와 일부 프로그램은 자막방송을 하므로 이러한 비디오에서는 텍스트를 추출할 수 있습니다.

그리고, Closed Caption이 포함되어 있는 디지털 방송 비디오와 DVD 비디오에서도 텍스트를 추출할 수 있습니다.

Q

Konan DigitalArc

A

디스크에 저장된 파일을 입력으로 받아서 ingestion하는 경우에는 실시간 보다 빨리 카타로깅 할 수 있습니다.

예를 들어, 1.5 Mbps 정도의 MPEG-1 비디오는 Intel Pentium4 2.4GHz dual cpu 정도의 시스템에서 실제 running time보다 8배정도의 속도로 카타로깅합니다.

8 Mbps 정도의 DVD 비디오의 경우에는 실제 running time보다 2배정도의 속도로 카타로깅이 가능합니다.

VCR의 출력 또는 지상파나 위성의 신호를 입력으로 받아서 인코딩하면서 카타로깅을 하는 경우에는 KONAN Cataloger가 처리할 입력의 속도가 실시간이기 때문에 실시간과 동일한 속도로 카타로깅을 합니다.

그러나, VCR이 SDTI로 출력을 하고 인코딩 시스템이 실시간 이상의 고속으로 인코딩을 하는 경우에는 실시간 이상의 속도로 카타로깅할 수 있습니다.

Q

Konan DigitalArc

A

NLE 시스템에서 아카이빙 되어 있는 비디오 컨텐츠를 검색하여 필요한 비디오를 실시간 보다 빠른 속도로 전송 받아서 사용할 수 있습니다.

그리고, Rough-Cut Editor(가편집기)의 결과인 EDL을 사용하는 경우 비디오 전체가 아닌 필요한 부분만 전송 받을 수 있습니다.

이 경우 네트워크의 부하와 전송 시간을 줄여서 결국 작업 효율을 높이게 됩니다.