Text To Video: Enhancing Video Generation Using Diffusion Models And Reconstruction Network

Jiayao Jin; Jianhang Wu; Zhoucheng Xu; Hang Zhang; Yaxin Wang; Jielong Yang

doi:10.1109/ccpqt60491.2023.00024

ScienceGate Book Chapters

JOURNAL ARTICLE

Text To Video: Enhancing Video Generation Using Diffusion Models And Reconstruction Network

Jiayao Jin Jianhang Wu Zhoucheng Xu Hang Zhang Yaxin Wang Jielong Yang

Year: 2023 Pages: 108-114

DOI: 10.1109/ccpqt60491.2023.00024

Get Full-Text PDF Get Analytical Report

Abstract

This paper proposes a method to improve the quality of generated videos in text to video generation techniques based on diffusion models, which suffer from low quality and poor continuity.The method involves dynamically adjusting the noise frame connections to enhance the video quality. A Reconstruction Net is introduced to automatically adjust the noise correlation among frames during the training process. Experimental results demonstrate that this method can enhance the quality of generated videos, improve video continuity, enhance the representation of image details, and strengthen the correspondence between generated and original videos. This research is of significant importance in advancing the development of text-based video generation techniques based on diffusion models.

Keywords:

Computer science Video quality Noise (video) Diffusion Frame (networking) Computer vision Artificial intelligence Process (computing) Representation (politics) Video denoising Quality (philosophy) Video processing Video tracking Image (mathematics) Multimedia Multiview Video Coding

Metrics

Cited By

0.36

FWCI (Field Weighted Citation Impact)

Refs

0.56

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Generative Adversarial Networks and Image Synthesis

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Video Analysis and Summarization

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Computer Graphics and Visualization Techniques

Physical Sciences → Computer Science → Computer Graphics and Computer-Aided Design

Text To Video: Enhancing Video Generation Using Diffusion Models And Reconstruction Network

Abstract

Metrics

Citation History

Topics

Related Documents

Enhancing Video Generation Based on Text-to-Image Diffusion Models Using a Multimodal Approach

Grid Diffusion Models for Text-to-Video Generation

Text-to-Video Generation Using Latent Diffusion Models: Structural and Temporal Analysis

Text to Video using GANs and Diffusion Models

ShotAdapter: Text-to-Multi-Shot Video Generation with Diffusion Models