Семинары по R: комментарии

Текст составлен участниками семинара П.А.Волковой и П.С.Бунтманом

Семинар 1

3 -- ^ --- степень

5 -- ...,3 --- округлять до третьего знака (по умолчанию до целого числа), форма записи 6e-23=6*10^(-23)

8 -- от 8 до 11

11 -- повторить "3" четыре раза

13 -- от 1 до 7 с интервалом 2

17 -- список объектов в памяти

19 -- удалить объект

30 -- матрица

31 -- логарифмическая матрица

49 -- структура объекта

Семинар 2

51 -- столбец

52 -- строка

55 -- сортировка колонок в алфавитном порядке названий островов

58 -- вектор названий островов

60 -- преобразование таблицы в матрицу

65 -- преобразование столбца в отдельный объект

67 -- список видов острова, можно попробовать не набирать выражение в квадратных скобках

70, 71 -- список растений, растущих на обоих островах

76 -- список растений, встречающихся только на первом острове, но не встречающихся на втором

79 -- сохранить все объекты, созданные к текущему моменту

80 -- сохранить отдельные объекты

Семинар 3

116 -- pie() --- круговая диаграмма

120 -- можно попробовать набрать противоположную команду --- detach

135--137 -- способ сохранения графика

143 -- qqnorm --- метод проверки нормальности

178 -- тест Стьюдента предназначен для нормально распределенных (и, конечно, непрерывных) данных

Семинар 4

195 -- структура

196 -- основные статистики

197 -- распределение значений переменных

198 -- 4 графика на одном рисунке

199 -- гистограмма, то же самое, что и команда 200

200 -- i от 1 до 4, ссылка на элемент листа, main-заголовок, xlab-подпись по x

201--202 -- график плотности

206 -- попарные корреляции

208--212 -- как поступать с пропущенными данными

208 -- пропустить пропущенные данные

209 -- создается копия файла

210 -- пропущенные данные заменяются на медиану

211 -- просмотр

212 -- коэффициенты корреляции

214 -- корреляционная матрица в строчку

215 -- сортировка коэффициентов корреляции по возрастанию для выявления максимальных по модулю

219 -- деление данных в переменной на два интервала, (0,16,30) обозначает, что все значения делятся на группы от 0 до 16 и от 16 до 30, и им соответственно присваиваются имена "lpet", "hpet"; 14 и 16 --- "провалы" в гистограммах.

220 -- пестики делятся на "большие" (от 16 до 30) и "маленькие" (от 0 до 16)

222 -- хи-квадрат-тест на независимость: если p маленькое, то данные зависимы

223 -- два графика в одном окне

225 -- выявление связи между балльными данными: различаются цветки с разным количеством лепестков еще и по количеству тычинок (если p большое, то нет)?

229 -- регрессионный анализ, здесь ANTHERS --- x, а PISTILS --- y

231 -- коэффициент линейной связи между переменными

232 -- линейная модель зависимости между переменными, col --- цвет линии, lty --- тип линии

234 -- надпись на графике

235 -- сохранение графика с заданием размеров

238 -- сохранение всех команд

239 -- вывод содержимого в файл

241 -- закрытие файла для вывода

242 -- редактирование введенных команд

243 -- внешняя библиотека команд (пакет)

244 -- подробное описание данных

245 -- корреляционный анализ (метод Спирмана)

Семинар 5

260 -- сортирует значения корреляции в порядке возрастания

261 -- открытие внешней библиотеки многомерного анализа

262 -- генерация номеров переменных, цифры в скобках обозначают значения переменных (здесь --- от 1 до 10)

263 -- анализ главных компонент для признаков с 3 по 9 на основе ковариационной матрицы

264 -- результат анализа главных компонент

265 -- посмотреть вклады отдельных признаков в факторы

266 -- создание нового "предсказанного" объекта

267--275 -- "украшательство"

268 -- палитра

269 -- график из точек

270 -- подпись --- значения десятой переменной, цвет точки зависит от значения первой переменной

272 -- при щелкании мышкой по точке графика появляется "номер популяции:номер особи", для завершения этого режима надо нажать правую клавишу мыши; offset --- смещение подписи

273 -- график со второй и третьей главными компонентами

274 -- график с первой и третьей главными компонентами

275 -- устанавливается палитра по умолчанию (исходный вариант)

276 -- на одном графике показаны точками показаны особи и красными стрелками --- вклады в факторы

279 -- удаление выбранных объектов (тех, которые начинаются на "pl.p")

280 -- подключение еще одной внешней библиотеки

283 -- графическое отображение результатов многомерного шкалирования (начало координат в центре)

284 -- режим "щелканья на точку графика"

285 -- палитра

286 -- график

287 -- тип субстрата (переменная 10) можно "положить на линейную шкалу"

288 -- ввод дистанции

289 -- применение метода Уорда

290, 291 -- дендрограммы

292 -- выбор уровня "обрезки дендрограммы" так, чтобы было 5 кластеров

294, 295 -- "электронный определитель" с записью результата в исходную таблицу данных

295 -- все диагнозы, которые не отвечают условиям N 294; "[]" - вывод результатов на экран, "!" - отрицание написанного за этим знаком

296 -- количество растений каждого вида

297 -- "обрезать" дендрограмму до трех кластеров, получим переменную, в которой для каждого растения будет записан номер одного из трех кластеров, к которому оно отнесено

298 -- сравнение результатов кластерной классификации и электронного определения (они не совпадают)

302 -- сравнение результатов двух типов кластеризации (они совпадают)

306 -- R=0, следовательно, результаты кластерного анализа не соответствуют выделяемым видам

307 -- библиотека команд рекурсивного деления (расширенный дискриминантный анализ)

308--314 -- модель, результаты анализа которой похожи на дихотомический ключ