• Description

在德國法蘭克福(歐德)的歐洲大學Viadrina開發了一個商業互聯網應用數據庫(Internet Database,簡稱IDB)。 IDB的目的是記錄企業互聯網使用的最新技術,重點關注企業對企業的應用。這個數據庫在之前描述過(Kurbel,1997)。
網路應用程序的數量和多樣性是巨大的,而且還在快速增長。由於我們主要對數據庫的創新解決方案感興趣,所以問題是如何找到這些解決方案。一種方式當然是“手動”搜索,即使用基於關鍵字的搜索引擎(如Alta Vista)或瀏覽WWW(“黃頁”,商業服務器等)中的公司列表並分析各個WWW提供。這顯然是一個累人而費時的任務。搜索過程的自動化是可取的。
WWW這個詞是用來描述公司通過互聯網為商業夥伴提供特定信息的一般事實。本文提出的方法是自動化過程預先選擇WWW提供的數據庫可能感興趣的東西。最後的決定是由一個人做出的。預選步驟基於神經網絡方法。它通過對WWW提供進行分類來減少Web中的信息過載。為此,訓練並測試了具有誤差反向傳播的多層感知器的15個版本(Wassermann,1989),四個版本的廣義前饋網絡和四個版本的模塊化網絡。
由於數據庫的重點是企業對企業,所以面向消費者的WWW產品被認為是“不感興趣的”。在企業對企業領域,“有趣的”應用程序是商業交易基本上基於因特網使用的應用程序。更確切地說,之前提出的兩種分類方案被用來區分WWW提供的兩組“有趣”和“不感興趣”的提議。在(Kurbel,1997)中,企業對企業的應用分為兩種觀點:a)商業夥伴之間的直接溝通; b)與或通過信息交流的溝通。
對於第一組(直接通信),定義了六個主要類別:

1.提供信息

2.提供信息和聯繫方式

3.通過互聯網開始交易

4.通過互聯網開始和完成交易

5.通過互聯網的業務流程接口

類別1)和2)通常是公司宣傳冊放在網絡上的地方,但讀者不能僅僅閱讀它。 WWW對這些類別的報價被宣佈為“不感興趣”,而類別3)到6)的報價有可能對IDB“有趣”。

對於第二組(信息交流),提出了四類(Kurbel,1997):

1.簡單的公司和/或產品目錄

2.帶有搜索選項的目錄

3.產品交換

4.電子市場

在這裡,類別1)和2)被認為是不感興趣的。類別3)和4)包含那些經營信息交換的調解人為商業夥伴之間的交易提供自動支持的報價。這些類別被認為是“有趣的”。

在下一節中,介紹用於分類任務的神經網絡。接下來的部分將介紹自動搜索的過程和分類方法。之後,給出了網絡的具體配置,並對實驗結果進行了討論。結論部分給出了未來改進的總結和展望。