“Web数据挖掘:超文本数据的知识发现”的意思、由来-中文百科全书

作者简介

SoumenChakrabarti，Web搜索与挖掘领域的知名专家，ACMTransactionsontheWeb副主编。加州大学伯克利分校博士，目前是印度理工学院计算机科学与工程系副教授。曾经供职于IBMAlmaden研究中心，从事超文本数据库和数据挖掘方面的工作。他有丰富的实际项目开发经验，开发了多个Web挖掘系统，并获得了多项美国专利。

编辑推荐

《Web数据挖掘》是Web挖掘与搜索引擎领域的经典著作，自出版以来深受好评，已经被斯坦福、普林斯顿、卡内基梅隆等世界名校采用为教材。书中首先介绍了Web爬行和搜索等许多基础性的问题，并以此为基础，深入阐述了解决Web挖掘各种难题所涉及的机器学习技术，提出了机器学习在系统获取、存储和分析数据中的许多应用，并探讨了这些应用的优劣和发展前景。

《Web数据挖掘》分析透彻，富于前瞻性，为构建Web挖掘创新性应用奠定了理论和实践基础，既适用于信息检索和机器学习领域的研究人员和高校师生，也是广大Web开发人员的优秀参考书。

词条	Web数据挖掘:超文本数据的知识发现
释义	《Web数据挖掘》是信息检索领域的名著，深入讲解了从大量非结构化Web数据中提取和产生知识的技术。书中首先论述了Web的基础（包括Web信息采集机制、Web标引机制以及基于关键字或基于相似性搜索机制），然后系统地描述了Web挖掘的基础知识，着重介绍基于超文本的机器学习和数据挖掘方法，如聚类、协同过滤、监督学习、半监督学习，最后讲述了这些基本原理在Web挖掘中的应用。本书为读者提供了坚实的技术背景和最新的知识。是从事数据挖掘学术研究和开发的专业人员理想的参考书，同时也适合作为高等院校计算机及相关专业研究生的教材。书名：Web数据挖掘：超文本数据的知识发现作者：（印度）(SoumenChakrabarti)查凯莱巴蒂 ISBN：9787115194046 定价：59.00 元出版社：人民邮电出版社出版时间：2009 开本：16 作者简介编辑推荐目录作者简介 SoumenChakrabarti，Web搜索与挖掘领域的知名专家，ACMTransactionsontheWeb副主编。加州大学伯克利分校博士，目前是印度理工学院计算机科学与工程系副教授。曾经供职于IBMAlmaden研究中心，从事超文本数据库和数据挖掘方面的工作。他有丰富的实际项目开发经验，开发了多个Web挖掘系统，并获得了多项美国专利。编辑推荐《Web数据挖掘》是Web挖掘与搜索引擎领域的经典著作，自出版以来深受好评，已经被斯坦福、普林斯顿、卡内基梅隆等世界名校采用为教材。书中首先介绍了Web爬行和搜索等许多基础性的问题，并以此为基础，深入阐述了解决Web挖掘各种难题所涉及的机器学习技术，提出了机器学习在系统获取、存储和分析数据中的许多应用，并探讨了这些应用的优劣和发展前景。《Web数据挖掘》分析透彻，富于前瞻性，为构建Web挖掘创新性应用奠定了理论和实践基础，既适用于信息检索和机器学习领域的研究人员和高校师生，也是广大Web开发人员的优秀参考书。目录 INTRODUCTION 1.1CrawlingandIndexing 1.2TopicDirectories 1.3ClusteringandClassification 1.4HyperlinkAnalysis 1.5ResourceDiscoveryandVerticalPortals 1.6Structuredvs.UnstructuredDataMining 1.7BibliographicNotes PARTⅠINFRASTRUCTURE 2CRAWLINGTHEWEB 2.1HTMLandHTTPBasics 2.2CrawlingBasics 2.3EngineeringLarge-ScaleCrawlers 2.3.1DNSCaching,Prefetching,andResolution 2.3.2MultipleConcurrentFetches 2.3.3LinkExtractionandNormalization 2.3.4RobotExclusion 2.3.5EliminatingAlready-VisitedURLs 2.3.6SpiderTraps 2.3.7AvoidingRepeatedExpansionofLinksonDuplicatePages 2.3.8LoadMonitorandManager 2.3.9Per-ServerWork-Queues 2.3.10TextRepository 2.3.11RefreshingCrawledPages 2.4PuttingTogetheraCrawler 2.4.1DesignoftheCoreComponents 2.4.2CaseStudy:Usingw3c-1ibwww 2.5BibliographicNotes 3WEBSEARCHANDINFORMATIONRETRIEVAL 3.1BooleanQueriesandtheInvertedIndex 3.1.1StopwordsandStemming 3.1.2BatchIndexingandUpdates 3.1.3IndexCompressionTechniques 3.2RelevanceRanking 3.2.1RecallandPrecision 3.2.2TheVector-SpaceModel 3.2.3RelevanceFeedbackandRocchio'sMethod 3.2.4ProbabilisticRelevanceFeedbackModels 3.2.5AdvancedIssues 3.3SimilaritySearch 3.3.1Handling"Find-Similar"Queries 3.3.2EliminatingNearDuplicatesviaShingling 3.3.3DetectingLocallySimilarSubgraphsoftheWeb 3.4BibliographicNotes PARTⅡLEARNING SIMILARITYANDCLUSTERING 4.1FormulationsandApproaches 4.1.1PartitioningApproaches 4.1.2GeometricEmbeddingApproaches 4.1.3GenerativeModelsandProbabilisticApproaches 4.2Bottom-UpandTop-DownPartitioningParadigms 4.2.1AgglomerativeClustering 4.2.2Thek-MeansAlgorithm 4.3ClusteringandVisualizationviaEmbeddings 4.3.1Self-OrganizingMaps(SOMs) 4.3.2MultidimensionalScaling(MDS)andFastMap 4.3.3ProjectionsandSubspaces 4.3.4LatentSemanticIndexing(LSI) 4.4ProbabilisticApproachestoClustering 4.4.1GenerativeDistributionsforDocuments 4.4.2MixtureModelsandExpectationMaximization(EM) 4.4.3MultipleCauseMixtureModel(MCMM) 4.4.4AspectModelsandProbabilisticLSI 4.4.5ModelandFeatureSelection 4.5CollaborativeFiltering 4.5.1ProbabilisticModels 4.5.2CombiningContent-BasedandCollaborativeFeatures 4.6BibliographicNotes 5SUPERVISEDLEARNING 5.1TheSupervisedLearningScenario 5.2OverviewofClassificationStrategies 5.3EvaluatingTextClassifiers 5.3.1Benchmarks 5.3.2MeasuresofAccuracy 5.4NearestNeighborLearners 5.4.1ProsandCons 5.4.2IsTFIDFAppropriate? 5.5FeatureSelection 5.5.1GreedyInclusionAlgorithms 5.5.2TruncationAlgorithms 5.5.3ComparisonandDiscussion 5.6BayesianLearners 5.6.1NaiveBayesLearners 5.6.2Small-DegreeBayesianNetworks 5.7ExploitingHierarchyamongTopics 5.7.1FeatureSelection 5.7.2EnhancedParameterEstimation 5.7.3TrainingandSearchStrategies 5.8MaximumEntropyLearners 5.9DiscriminativeClassification 5.9.1LinearLeast-SquareRegression 5.9.2SupportVectorMachines 5.10HypertextClassification 5.10.1RepresentingHypertextforSupervisedLearning 5.10.2RuleInduction 5.11BibliographicNotes 6SEMISUPERVISEDLEARNING 6.1ExpectationMaximization 6.1.1ExperimentalResults 6.1.2ReducingtheBeliefinUnlabeledDocuments 6.1.3ModelingLabelsUsingManyMixtureComponents …… PARTⅢAPPLICATIONS ……
随便看	慈禧后宫实录慈禧画传慈禧陵慈禧秘密生活慈禧秘史慈禧墓慈禧那些事儿慈禧全传慈禧式煎小块牛排慈禧书“福禄寿”三字轴慈禧水道慈禧太后慈禧太后和她身边的男人们慈禧太后行宫慈禧太后演义慈禧太后养生粥慈禧太后叶赫那拉氏慈禧太后胭脂沟慈禧西行慈禧西行记慈禧肖像慈禧夜明珠慈禧玉女美胸酥慈禧珍珠茶慈禧坐火车关于争端解决规则与程序的谅解关于企业所得税若干优惠政策的通知关于制止低价倾销行为的规定关于商品和服务实行明码标价的规定关于商品和服务实行明码标价的规定实施细则关于商场和办公楼分割转让问题的通知关于国家助学贷款的管理规定（试行）关于在国际贸易中对某些危险化学品和农药采用事先知情同意程序的鹿特丹公约关于在房地产开发项目中推行工程建设合同担保的若干规定（试行）关于外商举办投资性公司的补充规定关于外商参与打捞中国沿海水域沉船沉物管理办法关于外国企业常驻代表机构的登记管理办法关于外国财产保险分公司改建为独资财产保险公司有关问题的通知关于大豆关于实施《劳动保障监察体例》若干规定关于对农业特产收入征收农业税的规定刘奇葆刘奉仉刘奉岭刘奋斗刘奎基刘奎生烈士刘奎童刘奎裕烈士刘奕

作者简介

编辑推荐

目录