Tóm tắt video dựa trên biểu diễn đặc trưng của đoạn clip

Bài viết này giới thiệu cách tiếp cận dựa trên biểu diễn đặc trưng của đoạn clip, khai thác thông tin không gian và thời gian qua cơ chế học tự chú ý (self-attention). Kết quả thực nghiệm cho thấy cách tiếp cận này có tiềm năng lớn cho các ứng dụng tóm tắt video thực tế.