10 Советов по работе с пакетами в R

10 Советов по работе с пакетами в R - манекенах

Одной из очень привлекательных особенностей R является то, что она содержит большую коллекцию сторонних пакетов (коллекции функций в четко определенном формате) , Чтобы получить максимальную отдачу от R, вам нужно понять, где найти дополнительные пакеты, как их загрузить и установить, и как их использовать.

Прокидывание укромных уголков CRAN

Всеобъемлющая сеть R-архивов (CRAN) - это сеть веб-серверов по всему миру, где вы можете найти исходный код R, руководства и документацию R, а также предоставленные пакеты.

CRAN - это не один веб-сайт; это коллекция веб-серверов, каждая из которых имеет идентичную копию всей информации о CRAN. Таким образом, каждый веб-сервер называется зеркалом . Идея заключается в том, что вы выбираете зеркало, которое находится ближе всего к тому месту, где вы находитесь, что уменьшает международный или междугородный интернет-трафик. Здесь вы можете найти список зеркал CRAN.

Независимо от того, какой интерфейс R вы используете, вы можете навсегда сохранить свое предпочтительное зеркало CRAN (и другие настройки) в специальном файле. RProfile, расположенный в домашнем каталоге пользователя или в каталоге запуска R. Например, чтобы установить Имперский колледж, зеркало Великобритании в качестве зеркала CRAN по умолчанию, включите эту строку в свой. RProfile:

 options ("repos" = c (CRAN = " // cran. Ma. Imperial. Ac. Uk /")) 

Поиск интересных пакетов

В начале 2015, было более 6 000 пакетов на CRAN. Это означает, что поиск пакета для вашей задачи под рукой может показаться сложным.

К счастью, несколько экспертов-добровольцев собрали некоторые из наиболее широко используемых пакетов в кураторские списки. Эти списки называются задачами задач CRAN. Вы можете найти виды задач для эмпирического финансирования, статистической генетики, машинного обучения, статистического обучения и многих других увлекательных тем.

Каждый пакет имеет свою собственную веб-страницу на CRAN. На веб-странице для пакета вы найдете сводку, информацию об используемых пакетах, ссылку на веб-сайт пакета (если такой сайт существует) и другую полезную информацию.

Установка пакетов

Для установки пакета используйте установку. packages (). Эта простая команда загружает пакет из указанного репозитория (по умолчанию, CRAN) и устанавливает его на вашем компьютере: >> install. пакеты («судьбы»)

 Обратите внимание, что аргумент для установки. packages () - это символьная строка. Другими словами, помните кавычки вокруг имени пакета! 

В RGui, а также в RStudio вы найдете команду меню, чтобы сделать то же самое:

В RGui выберите «Пакеты» → «Установить пакеты».

  • В RStudio выберите «Инструмент» → «Установить пакеты» ...

  • Загрузка пакетов

Чтобы загрузить пакет, вы используете функцию library () или require (). Эти функции идентичны по своим эффектам, но они различаются по возвращаемому значению:

library ()

  • : Невидимый возвращает список прикрепленных пакетов или останавливается с ошибкой, если пакет не включен вашей машины. require ()

  • : Возвращает TRUE, если пакет был успешно присоединен и FALSE, если нет.

    Документация R предполагает, что библиотека () является предпочтительным способом загрузки пакетов в сценарии, а require () предпочтительнее внутри функций и пакетов.

Итак, после установки пакета fortunes вы загружаете его следующим образом: >> library («fortunes»)

Обратите внимание, что вам не нужно указывать имя пакета в аргументе библиотеки () , но рекомендуется всегда указывать имя пакета.

 

Хотя можно разгрузить пакет в сеансе R с помощью функции detach (), на практике обычно проще просто перезапустить сеанс R.

Считывание руководства по упаковке и виньетка

Руководство по упаковке представляет собой набор всех функций и другой документации по пакетам. Вы можете получить доступ к руководству двумя способами. Первый способ - использовать аргумент help для функции library ():

>> library (help = "fortunes")

Второй способ - найти руководство на веб-сайте пакета. Если вы укажете свое окно браузера на страницу CRAN для пакета fortune, вы увидите ссылку на руководство в нижней части страницы.

Какой бы подход вы ни выбрали, результатом является документ PDF, содержащий руководство по пакету.
 Некоторые авторы пакетов также пишут один или несколько 

виньет,

документов, которые иллюстрируют, как использовать пакет. Виньетка обычно показывает некоторые примеры того, как использовать функции и как начать работу. Главное, что виньетка показывает, как использовать пакет с R-кодом и выходом, как и эта книга.

Чтобы прочитать виньетку для пакета fortunes, попробуйте следующее: >> vignette («fortunes») Обновление пакетов Чтобы убедиться, что у вас установлена ​​последняя версия пакета, используйте обновление. packages (): обновление >>. packages ()

Эта функция подключается к CRAN (по умолчанию) и проверяет наличие обновлений для всех пакетов, установленных на вашем компьютере. Если есть, он спрашивает вас, хотите ли вы обновить каждый пакет, а затем загрузите код и установите новую версию.

 Если вы добавите обновление. пакетов (ask = FALSE), R обновляет все устаревшие пакеты в текущем месте библиотеки, не запрашивая вас. Кроме того, вы можете сообщить об обновлении. packages (), чтобы посмотреть репозиторий, отличный от CRAN, изменив аргумент repos. Если аргумент repos указывает на файл на вашем компьютере (или сети), R устанавливает пакет из этого файла. 

В RGui и RStudio есть опции меню, которые позволяют вам обновлять пакеты:

В RGui выберите «Пакеты» → «Обновить пакеты».

 В RStudio выберите Инструменты → Проверить обновления пакетов ... 

Оба приложения позволяют вам графически выбирать пакеты для обновления.

Продвижение вперед с R-Forge

Хотя это не универсально, пакеты на CRAN имеют минимальный уровень зрелости.

  • Итак, где живут пакеты, которые находятся в цикле разработки? Довольно часто они живут в R-Forge. R-Forge предоставляет разработчикам платформу для разработки и тестирования своих пакетов R. Например, R-Forge предлагает

Система сборки и проверки в операционных системах Windows и Linux (Mac OSX не поддерживается)

Управление версиями

Системы отчетов об ошибках

Резервное копирование и администрирование

Для установки проект от R-Forge, вы также используете установку. packages (), но вы должны указать аргумент repos. Например, чтобы установить версию версии данных пакета. таблицу, попробуйте следующее:
  • >> установить. пакеты ("data. table", repos = " // R-Forge. R-project. org")

  • Хотя у R-Forge нет системы сборки и проверки для Mac OSX, пользователи Mac могут устанавливать и использовать пакеты из R-Forge путем установки исходного пакета. Вы найдете дополнительную информацию в FAQ для Mac.

  • Получение пакетов из github

  • В последние годы многие разработчики начали использовать github в качестве сайта разработки кода. Хотя github не предлагает каких-либо R-специфических функций CRAN или R-Forge, иногда код проще делиться с помощью github. Поэтому вы можете иногда получать инструкции по установке пакета непосредственно из github.

В операционных системах Linux и Mac OSX установка пакетов из github сравнительно проста. Однако в Windows вы также должны сначала установить RTools (набор компиляторов и другие инструменты для сборки пакетов из исходного кода). Чтобы установить RTools на машину Windows, внимательно следуйте инструкциям.
 Проведение установок из BioConductor 

BioConductor - это хранилище пакетов и программного обеспечения R, набор инструментов, которые специализируются на анализе геномных и связанных данных.

BioConductor имеет свои собственные правила для разработчиков. Например, чтобы установить пакет из BioConductor, вы должны исправить скрипт с его сервера: >> source (« // bioconductor. org / biocLite. R»)

Затем вы можете использовать biocLite () для установки пакетов из BioConductor. Если вы не предоставите аргумент, вы просто установите необходимые базовые пакеты из проекта BioConductor.

BioConductor широко использует программно-ориентированное программирование с классами S4.

Чтение руководства R

Руководство по установке и администрированию R - это подробное руководство по установке и администрированию R. В главе 6 этого руководства содержится вся информация, необходимая для работы с пакетами.