Professor Information Scraper机器人

2023-02-08 brownMale 原文

import requests
from bs4 import BeautifulSoup

# Base URL for the database of MIT CS professors
base_url = "https://www.eecs.mit.edu/"

# Make a request to the database of MIT CS professors
response = requests.get(base_url, verify=True)

# Check if the request was successful
if response.status_code == 200:
    # Parse the HTML content of the page
    soup = BeautifulSoup(response.text, "html.parser")

    # Find the elements containing the professor information
    professor_elements = soup.find_all("div", class_="views-row")

    # Loop through the professor elements and extract their information
    for i, professor in enumerate(professor_elements):
        if i == 30:
            break

        name = professor.find("h2").text
        email = professor.find("a", class_="email").text
        area_of_interest = professor.find("div", class_="field-name-field-research-areas").text

        # Store the information for each professor in a dictionary
        professor_dict = {
            "name": name,
            "email": email,
            "area_of_interest": area_of_interest
        }

        # Append the dictionary to a list
        professor_info.append(professor_dict)

# If the request was not successful, print an error message
else:
    print("Failed to retrieve data from the website.")

# Print the list of dictionaries
print(professor_info)

为什么代码无法从网站检索数据？这是一个剪贴器，它可以访问麻省理工学院的教授数据库，收集他们的电子邮件、姓名和电子邮件机器人感兴趣的区域，但剪贴器无法在atm机上工作。

Professor Information Scraper机器人的更多相关文章

我如何在数千种变体中为我的ML模型选择最佳设置？

我使用MLRandomForest模型，我希望尽可能地设置它的所有重要参数。因此，为此，我在多个循环中尝试所有可能的变量并保存它们的结果。当我完成时，我只是查看结果，哪种设置是最好的。因此，我向您提出了两个问题：做我正在做的事情是好的吗？我的意思是通过所有变体来找到最佳设置由于我的内存限制，可以在某个网站上完成吗？在线免费编译器，我可以在其上加载数据文件，并要求他们为我计算变量。
Professor Information Scraper机器人

为什么代码无法从网站检索数据？这是一个剪贴器，它可以访问麻省理工学院的教授数据库，收集他们的电子邮件、姓名和电子邮件机器人感兴趣的区域，但剪贴器无法在atm机上工作。
为什么ML模型应该对一个输出特性进行很好的预测？

完成训练后，我将两个输出特征的真实值与预测值进行了比较，结果如下图所示我的问题是，为什么这个模型只能预测一个输出特性？
C编程语言中最好的机器学习库/框架

用C语言实现的最佳机器学习代码是什么？我做了一些搜索，找到了一些多特蒙德大学的代码，比如“mysvm”，但我想要一个包含不同类型算法的库。
当一个变量与另一个变量之间似乎没有相关性时，如何找到它们的影响？

我们可以预测一个项目的销售额增长百分比吗？将上一年的折扣变化作为预测变量。这些之间似乎没有关联。如何使用机器学习解决这个问题？
用sklearn拟合多维数据的线性回归

我正在尝试使用时间序列数据上的sklearn拟合线性回归。唯一的问题是，据我所知，数据不符合通常的时间序列格式。下面是一个示例：我很抱歉，如果这有点难读，但我的想法是，每个列表都代表了当时的一些上下文，其中的每个列表。这是可以的，除非我有多个上下文，但我希望它们都在同一个模型上训练。顺便说一句，当运行上面的代码时，我会得到逻辑上的错误：因为，sklearn需要以下格式的数据：
我们如何使用功能重要性来查找&#39；最差&#39；特征？

基本上，我想运行一个功能重要性练习，以找到对从属功能影响最大的顶级独立功能。我如何使用此模型来查找与顶级独立功能相关联的ID？查看图后，是否只是按RM、LSTAT和DIS的降序对数据帧进行排序，因为这些是影响从属特性的最具影响力的特性？我不认为它是这样工作的，但也许就是这样。在这种情况下，考虑到我的业务需求，我假设RM、LSTAT和DIS是“最差”的功能。

随机推荐

如何扩展ATmega324PB微控制器的以下宏寄存器？

我目前正在学习嵌入式，我有以下练习：展开以下宏寄存器：如果有人解决了这个问题，我将不胜感激，以便将来参考
Python将ONNX运行时设置为返回张量而不是numpy数组

在python中，我正在加载预定义的模型：然后我加载一些数据并运行它：到目前为止，它仍在正常工作，但我希望它默认返回Tensor列表，而不是numpy数组。我对ONNX和PyTorch都是新手，我觉得这是我在这里缺少的基本内容。这将使转换中的一些开销相同。
在macOS上的终端中使用Shell查找文件中的单词

我有一个文本文件，其中有一行：我需要找到ID并将其提取到变量中。我想出了一个RexEx模式：但它似乎对我尝试过的任何东西都不起作用：grep、sed——不管怎样。我的一个尝试是：我为这样一个看似愚蠢的问题感到抱歉，但我在互联网上找不到任何东西：我在SO和SE上读了几十个类似的问题，并在谷歌上搜索了几个教程，但仍然无法找到答案。欢迎提供任何指导！
react-chartjs-2甜甜圈图中只有标题未更新

我正在使用react-chartjs-2在我的网站中实现甜甜圈图。下面是我用来呈现图表的代码。我将甜甜圈图的详细信息从父组件传递到子组件，所有道具都正确传递。当我在beforeDraw函数外部记录props.title时，它会记录正确的值，但当我在beforeDraw函数内部记录props.title时，它将记录标题的前一个值，从而呈现标题的前值。我在这里做错了什么？
如何在tkinter中使用Python生成器函数？

生成器函数承诺使某些代码更易于编写。但我并不总是知道如何使用它们。假设我有一个斐波那契生成器函数fib()，我想要一个显示第一个结果的tkinter应用程序。当我点击“下一步”按钮时，它会显示第二个数字，依此类推。我如何构建应用程序来实现这一点？我可能需要在线程中运行生成器。但如何将其连接回GUI？
如何为每次提交将存储库历史记录拆分为一行？

我正在尝试获取存储库的历史记录，但结果仅以单行文本的形式返回给我。
尝试在颤振项目上初始化Firebase时出错

当尝试在我的颤振项目上初始化firebase时，我收到了这个错误有人知道我能做什么吗？应用程序分级Gradle插件Gradle项目颤振相关性我已经将firebase设置为Google文档已经在另一个模拟器上尝试过，已经尝试过创建一个全新的模拟器，已经在不同的设备上尝试过了，已经尝试了特定版本的firebase，已经尝试添加但没有任何效果，已经在youtube上看到了关于它的每一个视频，该应用程序在android和iOS两个平台上都抛出了这个错误
在unix中基于当前日期添加新列

我试图在unix中基于时间戳列在最后一个单元格中添加一个状态列。我不确定如何继续。
麦克斯·蒙特利。我一直得到UncaughtReferenceError：当我在终端中写入node-v时，节点未定义

如果这是您应该知道的，请确认：我已将所有shell更改为默认为zsh。当我在终端中写入node-v时，我一直收到“UncaughtReferenceError:nodeisnotdefined”。但它显示节点已安装。我是个新手，在这方面经验不足。
如何在前端单击按钮时调用后端中的函数？

那么如何在后端添加一个新的端点，点击按钮调用这个函数。