一、问题的提出
构建适合于多媒体网络教学的新一代校园网建设正在全国高校中,特别是以教学为主的院校中得到迅速的发展,而支持多媒体网络教学的核心是多媒体资源库的配套建设,研究基于校园网的多媒体资源库设计与建设正成为教育技术与网络技术工作者共同关注的问题,也是实现多媒体网络教学首先需要保证的前提条件,因此成为网络应用领域中的一个重要课题。
网络教学实现教师与学生在时间与空间上的跨越,突破传统面对面的课堂教学方式;在网络环境下,教师实现网上备课、网上教学、网上答疑;学生则在课程BBS教学论坛上提出学习中各种疑难问题、访问并调用多媒体课件库中的教师教案进行复习与预习等。
毫无疑问,网络教学需要强有力的多媒体资源库支持,需要丰富多彩的多媒体信息资源。面对海量的多媒体信息资源也需要跨平台的搜索引擎技术提供给教师与学生实现各种多媒体信息资源的检索。
多媒体资源库是由多媒体素材库、VOD视频点播系统、多媒体课件库和课程BBS系统等部分组成的多媒体教学应用平台。为此,本文将重点讨论多媒体资源库的设计与建设,同时还对多媒体信息资源进行特征分析和跨平台搜索引擎的应用等方面与多媒体资源库相关联的技术展开讨论。关于多媒体资源库的设计与建设,本文将侧重于多媒体素材库。
二、多媒体资源库基本组成与工作原理
多媒体资源库较为理想的构架可以由多媒体素材库、课件库、案例库、习题库、课程BBS系统和VOD视频点播等系统组成。一般地,由多媒体资源库组成的教学应用平台建设是一个逐步完善的过程,本文讨论的多媒体资源库主要由多媒体素材库、多媒体课件库和VOD视频点播系统等三部分组成。
(一)基于多媒体网络教学的资源库系统的设计需求要点
高校通用型多媒体资源库设计与建设是为多媒体网络教学与学习服务的,适用于校园园区内部网使用。多媒体资源库的教学与学习功能是为以教师为主导的教学和以学生为主体的学习提供直接的技术支持。
采用“统一规划、分布实施”的设计步骤,多媒体资源库可采用由多媒体素材库、多媒体课件库和VOD视频点播系统等三部分组成的方式来构建。设计方案主要可从以下6个方面提出基本需求:
(1)建立一套本校内部使用的多媒体素材数据库系统,主要面向教师,为教学准备,也即为教师的备课提供服务。该系统对短片型的视音频文件,图片、动画和文本类等文件具有入库、管理与发布等功能。
(2)为各种教学素材的入库提供入库工具,在入库的同时自动生成可进行预览的缩微文件,特别是图片资料文件,对于基于表示形式的检索方式显得特别重要。
(3)多媒体素材库应具有海量存储能力,在超过数据库50万条记录的情况下,依然具有强大的检索能力。
(4)与多媒体素材库并行建立VOD视频点播系统,既可面向教师,也可面向学生,提供全方位的教学服务。该系统带有可控视频流技术,支持传送超过100个MPEG-1或MPEG-4点播视频流,视频图像质量回放平滑、流畅。
(5)与多媒体素材库并行建立多媒体课件库,支持用PowerPoint、Authorware、Director等多媒体著作工具制作的电子教案上传与下载。用于教师教学的同时,也为学生预习与复习课堂教学内容的个别化学习提供有效的帮助。
(6)多媒体素材库、课件库和VOD视频点播系统集成整合,形成后台数据多元内容,前台表现一致的多媒体资源库门户网站系统,搜索引擎实现跨平台检索,为海量多媒体信息资源检索提供高查准率和高查全率的技术支持。
(二)多媒体资源库系统技术框架与组成
多媒体素材库在多媒体资源库中占有突出的地位。多媒体素材库内核主要由全文检索系统、信息发布系统、Real流媒体服务系统等部分组成,全文检索也称为全文数据库检索,是通过计算机将各类文件的全貌等非文字信息转换成计算机可读形式的信息,对其特性直接采用自然语言来进行文字、图片、动画、视频、音频的特征描述。
作为多媒体素材的视频、音频和动画等形式的教学资料,可以运用入库转换工具生成流媒体文件形式存储于Real服务器中同时生成供检索、浏览用的流媒体形式的缩微文件一并存入Real服务器中。图片形式的教学素材利用转换工具通过Web入库界面直接进入专用全文检索服务器,生成供预览的缩微图片也一并存入专用全文检索服务器中。而图片类教学资料则直接通过入库工具界面入库并提供图片信息资料的外部特征说明。不论是视频、音频、动画,还是图片等多媒体信息资源,教师与学生对所有资源库的检索都是通过全文检索和信息发布系统来完成的,检索后的结果通过Web应用服务器予以发布,发布到校园网上的多媒体信息资源均提供预览、细览和下载等各项功能。
需要说明的是,多媒体素材库中的视频、音频文件为短片型的、零散型的视音频素材,VOD服务器中的视音频文件为相对成型或完整的视音频素材。VOD服务器、多媒体课件库等采用了另外的数据库类型,因此必须提供数据库网关来连接多媒体素材库中的全文检索服务器中。该网关可以实现不同数据库的数据与检索服务器数据库数据之间的迁移和自由流动,从而到达在一个检索服务器上跨平台检索的目的。
(三)多媒体素材库适用对象与基本原理
多媒体素材库主要面向教师,针对教师教学准备的需求提供丰富的、多元化的多媒体信息资源去完成适用于网络传输的多媒体课件制作。
对于流媒体形式的多媒体信息资源,在页面上可以调用Real浏览器或Real播放器来访问Real服务器,实现缩微文件的在线预览或整个流媒体文件的在线播放。
Real流媒体服务系统实现对视频、动画和音频等多媒体信息的转换、入库、管理和发布。视音频压缩服务器负责把视音频信号处理成Real服务器能够播放的媒体格式,教师与学生均可以通过浏览器并使用RealG2播放器,在网上可实现浏览多媒体素材库中的动画、短片型视频素材等流媒体文件和浏览VOD视频点播系统中片段型电视教材、卫星电视参考教材和文艺欣赏大片的流媒体文件。
全文检索服务器支持海量信息的存储与管理,Web应用服务器则利用数据库技术和动态网页生成技术,对Web应用服务器进行扩展可以将全文检索数据库中的信息动态自动发布。此外,全文检索与发布系统还提供管理员工具来管理全文检索服务器中的所有对象。
Real流媒体服务器系统则实现多媒体信息资源的转换、入库、管理和发布等过程。利用Real文件系统接插件将视频、音频和动画等多元媒体文件转换成流媒体文件,然后通过Real服务器实现流媒体信息的网上发布,用户在客户端利用Real播放器得到来自校园网网络系统的流媒体的播放。
实现跨平台检索,进行全文检索到分布式数据库管理系统RDBMS的数据迁移,需要VOD视频点播系统和多媒体课件库的数据库环境必须是关系型大型数据库,例如Oracle、SQLServer7.0等条件的技术支持。
三、跨平台搜索引擎在多媒体资源库中的运用
(一)多媒体信息资源的基本特征分析
多媒体素材库定义为海量型多媒体素材资料库,是设计与建设多媒体资源库的核心部分。多媒体素材库中多媒体数据有短片型、零散型的动态视频资料(1-3分钟)、图片、动画、表格和文字等文本资料,其特点第一是数据量大,数据量的发展是一个动态地不断发展的积累过程;其次是数据类型多,含有视频、动画、图片、音频等多种数据;再有就是数据类型之间的差别大。
数据量巨大和媒体之间量的差异大直接影响数据库的组织与存储方法。短片型的视频限定在1—3分钟的长度范围内,经过MPEG-1或MPEG-4方式数字压缩后也将达到几百K以上的数据量,而字符数据可能仅有几个字节。这就提出组织好多媒体数据库中的各类数据,才能充分利用磁盘阵列空间,使之能够快速存取。
媒体种类使数据处理难度增大。因为动态视频、动画、图片和文本等媒体在具体实现时需要根据系统的定义,标准转化等演变会生成更多种媒体格式。不同媒体类型对应不同的数据处理方式,在这情况下,一方面要求多媒体数据库管理系统DBMS能不断地扩充新的媒体类型及相应的操作方法,新增媒体类型对用户应是透明的。另一方面为了尽可能减少或避免这种多种媒体格式对应不同的数据处理方式,诸如动态视频媒体有AVI格式、DVI格式、MPEG-1、MPEG-2和MPEG-4等格式,可以通过一种数据处理格式的转换方式,即所有动态视频媒体格式均通过MPEG-4格式的转换,从而减少了同类型媒体又不同格式对应的不同的数据处理方式。文本素材的主要类型有教师教案、学位论文、学术成果、政策法规、历史资料等。汉字采用GB码统一编码与存储,英文字母和符号使用ASCⅡ编码与存储。
图片素材在多媒体素材库应占有相当的比重,其存储格式为GIF和JPG格式。彩色图像的颜色数不低于256色,灰度图片的灰度级不低于128级。扫描片像的扫描分辨率不低于150dpi。根据原始图片资料的图像质量,确定不同的转换标准,这样也就会在图片单一基础上演变出多种媒体格式。
(二)基于表示形式的检索与特征描述
基于表示形式的检索与数据类型运用以及数据结构有关,不需要对信息资源的内容加以分析,只需在多媒体信息录入时,人工或计算机自动地建立好关键字、词、句和信息特征描述的检索表,检索表与多媒体数据分开存储。
多媒体数据包含着十分丰富的信息内容,在多媒体素材库中运用到的信息资源包括动态视频、动画、图片和文本以及音频等多媒体信息资源,这些类型有着复杂的语义特征。对其特征用文字多层次、多角度的加以准确描述,是解决全方位检索的前提条件。文字描述信息资源特征的准确与否,关系到检索的查准率和查全率问题。
全文检索系统提供全方位的基于表示形式的检索功能,不仅允许使用正文中的任意字、词、句和片段进行检索,而且还能提供外部特征的检索,有48种检索运算符以及组合检索、位置检索、渐进/历史检索、词根检索、概念检索在内的多种检索方式。对于海量数据库而言,在基于关键词的检索系统中,应该具备智能扩展的检索功能,也即在特定关键检索时,不仅查出该关键词本身的数据,而且应该还能查出与关键词同义、近义的词所对应的数据。
可以说,用文字言语描述的特征是非常重要的环节,多媒体资源库要实现全方位的检索,保证检索高查准率和高查全率,信息资源特征的描述必须准确、到位。
在跨数据库平台的检索中,由于涉及到不同数据库系统之间的数据迁移和流动,因此,必须具备2个重要条件:第一要有内置到核心级的安全机制,保证数据安全;再有对于海量数据库迁移、流动一定要保证高的传输效率。
(三)跨平台检索的匹配条件
实现跨平台搜索引擎,需要引用关系型数据库搜索引擎使之从数据级别上将VOD视频点播系统和多媒体课件库系统的数据同步索引到专用数据库中,实现数据的检索和获取。专用关系数据库提供数据级别的无缝连接。通过专用关系型数据库网关接口,Web应用服务器可以透明连接Oracle、DB2、SQLServer7.0、Sybase和Informix等五大主流数据库管理系统。
关系型数据库网关由关系型数据库网关和与之分别对应Oracle、DB2、SQLServer7.0、Sybase和Informix的任务组件组成。分布式数据库管理系统RDBMS网关是运行在Win32平台上的自动化、智能化和定制化的任务处理工具,与任务组件共同完成关系数据库和文档数据库之间的数据迁移和将专用的格式文件中的批量数据装载到关系数据库或文档数据库中,此外,还处理同一关系数据库不同表/视图之间的数据迁移。
分布式数据库网关是实现跨平台检索的关键因素,它能够充分发挥数据库与文档管理各自的优势,有效地统一了多媒体信息资源。由于是在应用服务器一级的集成,实现了真正意义上的三层结构,这样数据库和专用服务器以及Web应用服务器可以分布在不同的系统和平台上,在检索、查阅和在线传输等各种应用中可以有效地解决负载均衡。特别重要的是高效的数据迁移功能,允许数据在各种数据库及专用文档库之间自由流动。除此之外,分布式数据库管理系统RDBMS网关的界面管理是智能化定时无人监管的运行工具,全面实现工作的智能化,这对正常运行的系统而言则是非常有价值的。
四、结语
基于跨平台检索技术的多媒体资源库主要由海量多媒体素材库、多媒体课件库和VOD视频点播系统等部分组成,多媒体课件库和VOD视频点播系统通过数据库网关实现跨平台检索。其中多媒体素材库内核主要由全文检索系统、信息发布系统和Real流媒体服务系统等部分组成,这是针对多媒体素材资源向海量方向发展而考虑的。
实现跨平台检索,进行全文检索到分布式数据库管理系统RDBMS的数据迁移,需要VOD视频点播系统和多媒体课件库的数据库环境是Oracle、SQLServer7.0等关系型大型数据库。
采用基于表示形式的全文检索,具有多种组合检索方式,在多媒体资源库的应用与管理中是先进性与实用性的有机结合。随着基于内容检索技术的成熟,采用内容检索方式必将更加有利于使用者和多媒体资源库管理者。